论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>职称论文>范文阅读
快捷分类: 论文中的文献综述 幼儿园文献综述 综述论文范文 论文综述模板 毕业论文文献综述 论文综述范文 不好文献综述 论坛文献综述 区域活动文献综述 文献综述事例 体育游戏文献综述 房地产财务风险文献综述

关于综述论文范文 网络文本评论中产品特征抽取综述相关论文写作参考文献

分类:职称论文 原创主题:综述论文 更新时间:2024-02-12

网络文本评论中产品特征抽取综述是关于本文可作为相关专业综述论文写作研究的大学硕士与本科毕业论文医学论文综述范文3000论文开题报告范文和职称论文参考文献资料。

〔摘 要〕随着Web2.0技术和电子商务的飞速发展,越来越多的用户通过互联网分享产品的使用体验和表达喜恶的观点,如何有效地从评论文本中抽取产品特征是产品意见挖掘方向所亟需解决的问题.本文从产品特征频繁项、特征-意见共现关系、模型训练和显隐式特征匹配四个方面介绍产品特征抽取工作在国内外的研究进展并指出其各自的优势和不足,最后列出产品特征抽取在今后的研究方向.

〔关键词〕在线评论;意见挖掘;特征抽取;文本分析

DOI:10.3969/j.issn.1008-0821.2016.08.031

〔中图分类号〕TP3911〔文献标识码〕A〔文章编号〕1008-0821(2016)08-0168-06

〔Abstract〕With the rapid development of Web20 technology and electronic commerce,more and more customers participate in the Internet,share product experience and express likes or dislikes about product.It is a challenge to extract product feature from customer reviews effectively in the product opinion mining field.Firstly,this paper introduced the research progress of extracting product feature from frequency,co-occurrence,modeling and implicit feature mapping both at home and abroad.Secondly,it presented their strength and limitation respectively.Finally,it enumerated some research interest about this task.

〔Key words〕online review;opinion mining;feature extraction;text analysis

近年来,随着Web20技术的发展,大量的在线产品评论文本不断涌现,对于有购买意向的潜在消费者来说,手工从产品评论中总结归纳出消费者对已购产品所持的褒贬态度是不现实的,尤其是意见相左的产品评论更让他们感到无所适从;对于生产厂家来说,从产品评论中了解消费者对产品整体或某一特征的意见,对企业竞争情报分析和后期产品质量的改进都大有裨益,因而对于评论中用户表达意见的研究具有重要意义.

随着物质文化生活水平的提高,人们对消费品需求日趋多元化、个性化,他们不再满足于产品的整体性能优劣,而是根据个人的消费喜好来关注产品的某一部件或属性的性能,较多关注产品局部的评论内容,因此如何准确全面抽取评论文本中所蕴含的产品特征信息是研究者所面临的重要问题.本文站在技术实现的角度从四个方面综述文本评论中产品特征抽取技术在国内外的研究进展及各自的优势和不足,最后指出产品特征抽取技术所面临的挑战和今后的发展方向.

1基于频繁项的特征抽取

该方法通常对评论语料中出现频率较高的名词或名词短语应用约束条件而抽取出来作为产品特征.产品特征词通常由名词、形容词、副词或动词组成.Liu[1]认为60%~70%的产品特征词是显式名词,由于人们习惯在评论中经常使用,因此产品的部件或属性常由经常出现的这类名词表示,同时还需要对频繁出现的名词中的非产品特征词进行过滤.

Hu[2]最先提出的基于特征摘 要(Feature-based Summarization)算法.他首先将产品评论中频繁出现的名词短语作为候选种子词,然后通过密实度修剪(Compactness Pruning)去掉那些未按照指定顺序在一起出现的无意义词以及冗余修剪(Redundancy Pruning)去掉未能表示产品特征的单个词,比如手机产品评论中的“时间”一词,只有在“待机时间”或“通话时间”的名词短语中才表示手机产品属性,单独出现则毫无意义,所以就把它从候选种子词中去掉.随后Popescu[3]基于如下假设:共现的次数越多的两个词,则它们之间的关联度越高,因此Popescu提出点互信息(Point-wise Mutual Information,PMI)方法比Hu的算法提高了22%的准确率,但是召回率降低了3%.Ku[4]利用TF*IDF从文档和段落级别来判断某词对产品特征的重要程度,Scaffidi[5]也用此方法将频繁出现的名词短语候选项在评论语料中的出现频率和在一般性英文中的出现频率进行比较.Raju[6]等人同样在实验中丢弃所有那些相比在产品描述中更为频繁出现在一般性英文中的名词短语,然后将剩下的描述产品同一特征的名词短语进行聚类,该模型通过双连词重叠(Bigram Overlap)值来衡量名词短语间的相似性,最后只保留至少含3个名词短语的聚类簇.Long[7]等人基于出现频率和信息距离(Information Distance)的考虑来抽取名词短语,他们首先通过统计频率方式找到产品特征核心词,然后利用信息距离来查找和产品特征相关的其他词或短语,如“”和“Dollars”均是产品价格属性的核心词.Hao[8]提出的基于语言依存分析和语料库统计相结合的未登录产品特征项抽取算法,实验证明抽取的前200个产品属性中准确率达到875%.

基于频繁项的产品特征抽取方式简单高效,许多商业机构通过这种方式分析客户对产品的反馈意见.但也导致了抽取过程中出现过多和产品特征无关的词汇同时漏掉那些不常出现的产品特征词.另外需要对各种阈值参数进行手工调整,因此移植性差.

总结:该文是关于综述论文范文,为你的论文写作提供相关论文资料参考。

参考文献:

1、 斑岩型铜矿成矿地质特征成因综述 摘要:斑岩型矿床是世界上最重要的矿床类型之一,约占世界铜总储量的50%以上,因此该类矿床一直是矿床学家研究的热点和矿业公司的首要勘查目标。本文通。

2、 新型农村社区环境公共产品供给特征 摘要:新型农村社区环境公共产品的有效供给是新农村建设的重要内容。本文阐述新型农村社区环境公共产品供给的特征,并提出新型农村社区环境公共产品供给的。

3、 刍议我国网络游戏产品市场营销策略 摘要:网络游戏产品是在网络信息技术飞速发展的过程中催生出的时代产物,这类产品的出现对我国市场经济的发展起到了很大的促进作用。随着网络游戏企业数量。

4、 大学生网络舆论行为特征调查和分析 摘 要:在自媒体背景下,研究大学生网络舆论现状及规律,研究影响大学生网络舆论行为的影响因素显得尤为重要,通过研究表明,大学生网络舆论行为受大学生。

5、 城乡居民个体特征、社会网络和借贷途径 摘 要:金融可获得性对于鼓励城乡居民借款进而刺激消费具有重要作用。城乡居民借贷作为家庭消费金融意识和需求的体现而备受关注。以2014年中国家庭追。

6、 国内公民网络参和文献综述 摘 要:本文在梳理国内有关公民网络参与文献的基础上,从概念界定、理论研究领域、实证研究领域三方面对公民网络参与进行总结与探讨。从现有研究成果中发。