一种基于商品评论的新情感词提取方法技术

技术编号：24457827 阅读：28 留言：0更新日期：2020-06-10 16:05

本发明专利技术公开一种基于商品评论的新情感词提取方法，目的是在商品评论领域获取更多的新情感词。该方法具体为：对商品评论语料库的每条评论进行预处理、分词以及词性、位置标记，并根据依存关系及二元搭配抽取规则从评论中获取<主题词，评价词>二元组；采用相邻词词性及位置、主题词和表情符号位置等特征进行粗粒度提取新情感词，再利用语法树来发现具有同位关系的其他新情感词；通过点互信息值和语料频数计算对当前已经提取的新情感词做细粒度筛选。该方法提取的新情感词可以一定程度上扩大情感词的规模，为更加全面、准确地基于商品评论进行情感分析奠定基础。

A new emotion word extraction method based on commodity review

全部详细技术资料下载

【技术实现步骤摘要】
一种基于商品评论的新情感词提取方法
本专利技术涉及文本分析
，特别涉及一种基于商品评论的新情感词提取方法。
技术介绍
在信息爆炸的互联网时代，电子商务也在逐渐改变着人们的工作与生活，越来越多的人习惯于网购，各大电商平台也成为了各种商品的主要销售渠道。为了更好地了解实际评价以及完善产品服务，电子商务网站几乎都会允许顾客对其所购买地商品发表评论观点。在这些评论中，包含了消费者对产品各个属性特征的评价以及情感观点。然而，这些商品评论信息不仅可以为其他消费者提供客观全面且真实的商品描述，也可以促进产品的研发及公司的发展，从而获得竞争优势。网络上存在海量的商品评论，这些评论中包含的大量有用信息，对这些评论进行挖掘及情感分析有着极大的实用价值。而对情感词的提取也是对商品评论进行情感分析的基本任务之一，情感词则是人们发表评价观点的最基本的语言单元。近年来，比较具有代表性的情感词典有知网情感词典(HowNet)、中国台湾大学的简体中文情感极性词典(NTUSD)、大连理工大学的情感词汇本体库等。但是现有情感词典在情感分析任务的使...

【技术保护点】
1.一种基于商品评论的新情感词提取方法，其特征在于：首先采用相邻词词性及位置、主题词和表情符号位置等特征来粗粒度提取新情感词；然后根据同位关系匹配方法来发现其他情感词，即利用语法树来发现具有同位关系的其他新情感词。/n

【技术特征摘要】
1.一种基于商品评论的新情感词提取方法，其特征在于：首先采用相邻词词性及位置、主题词和表情符号位置等特征来粗粒度提取新情感词；然后根据同位关系匹配方法来发现其他情感词，即利用语法树来发现具有同位关系的其他新情感词。

2.根据权利要求1所述的粗粒度提取方法，其特征在于：结合相邻词词性及位置、主题词和表情符号位置等特征统计旧情感词出现频率，再设置k＝4的滑动窗口获取不同词性词语、主题词以及表情符号周围4个字符以内的词语。
根据不同特...

【专利技术属性】
技术研发人员：张顺香，许汗清，尹畅，金鸣，徐善山，孟楠，
申请(专利权)人：安徽理工大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人