一种适应性情感分析系统及其方法技术方案

技术编号:22531923 阅读:22 留言:0更新日期:2019-11-13 09:12
一种适应性情感分析系统及其方法,包括包括用于情感分析的终端,所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;所述方面提取模块用于标识要进行情感分析的文本中的方面;所述情感极性分类模块对每个识别出的情感极性进行分类。所述方面提取模块包括有监督模式的方面提取子模块和无监督模式的方面提取子模块;并结合其它的方法和模块有效避免了现有技术中的情感分析方法通常过于简单化、未能提供精确的解决方案和对文本文件中包含的意见数据的细粒度分析的缺陷。

An adaptive emotion analysis system and its method

An adaptive affective analysis system and its method include a terminal for affective analysis, wherein the terminal for affective analysis includes an aspect extraction module and an affective polarity classification module; the aspect extraction module is used to identify aspects in the text to be affective analyzed; and the affective polarity classification module classifies each recognized affective polarity. The aspect extraction module includes the supervised pattern aspect extraction sub module and the unsupervised pattern aspect extraction sub module. In combination with other methods and modules, it effectively avoids the defects of the existing emotional analysis methods that are too simplistic, fail to provide accurate solutions and fine-grained analysis of the opinion data contained in the text file.

【技术实现步骤摘要】
一种适应性情感分析系统及其方法
本专利技术涉及情感分析
,具体涉及一种适应性情感分析系统及其方法,尤其涉及一种多语言适应性的情感分析系统及其方法。
技术介绍
随着大数据、人工智能技术的快速发展,语音、文本、图像、视频等多媒体信息得到大力挖掘,为用户提供了视觉、听觉等感官上的智能体验。而这些多媒体信息中,文本信息的重要性尤为突出。无论是语音到文字的转写,还是图像或视频的文本描述,文本数据的理解能为其它媒体信息提供更高层面的认知智能。而文本情感分析是对文本数据理解的一个重要方向,能帮助挖掘用户评论观点、进行商品口碑分析等。由此可见,在意见挖掘领域,情感分析是一个专注于研究人们对产品,服务,组织,话题和个体的情感,观点和态度的主观信息的领域。由于其对许多场景的适用性和重要性,情感分析已经成为一个热门的研究领域,在自然语言处理领域非常活跃。事实上,情感分析的发展与互联网本身和社交媒体的出现有关。万维网包含大量意见数据,由论坛,博客,在线新闻,社交媒体和客户评论中的真实用户生成。很多公司和机构都对这些数据很感兴趣,因为从中可以分析用户对产品或决定的意见。由于网上有大量的主观数据,人类不可能手动处理和总结。因此,需要自动情绪分析系统。情感分析领域的大多数研究都集中在开发能够预测整个文档的总体情绪分数的系统上。但是目前这些方法通常过于简单化,只关注计算文本中的正面或负面词汇,以总结整体情绪。他们未能提供精确的解决方案和对文本文件中包含的意见数据的细粒度分析。
技术实现思路
为解决上述问题,本专利技术提供了一种适应性情感分析系统及其方法,有效避免了现有技术中的情感分析方法通常过于简单化、未能提供精确的解决方案和对文本文件中包含的意见数据的细粒度分析的缺陷。为了克服现有技术中的不足,本专利技术提供了一种适应性情感分析系统及其方法的解决方案,具体如下:一种适应性情感分析系统,包括:用于情感分析的终端,所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;所述方面提取模块用于标识要进行情感分析的文本中的方面;所述情感极性分类模块对每个识别出的情感极性进行分类。所述方面提取模块包括有监督模式的方面提取子模块和无监督模式的方面提取子模块;所述有监督模式的方面提取子模块和无监督模式的方面提取子模块用于对来自文档集合的需要进行情感分析的文本文档提取其方面;所述情感极性分类模块包括有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块;所述有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块用于对方面和需要进行情感分析的文本文档分别进行预测,各自得到每个方面的情绪。所述用于情感分析的终端还包括并集模块和合并模块;所述并集模块用于通过并集操作方式来合并所提取的方面;所述合并模块用于合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,则最终情绪为中性。所述适应性情感分析系统的方法,包括两个子任务分别如下:(1)方面提取,其标识要进行情感分析的文本中的方面;(2)情感极性分类,其对每个识别出的情感极性进行分类。所述方面提取和情感极性分类均分为有监督模式和无监督模式,具体方式如下:首先,通过有监督模式的方面提取方法和无监督模式的方面提取方法对来自文档集合的需要进行情感分析的文本文档提取其方面;接着通过并集操作方式来合并所提取的方面;所述方面和需要进行情感分析的文本文档由有监督模式的情感极性分类方法和无监督模式的情感极性分类方法分别进行预测,各自得到每个方面的情绪;然后,合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,则最终情绪为中性。所述适应性情感分析系统可以处理任何语言;对于所述监督模式,只要可以为特定语言提供训练数据,在此监督模式下的方面提取和基于方面的情感极性分类的方法可以学习如何对文档的情感进行分类,为该语言构建模型;而对于所述无监督模式。其基于通用依赖分析方式指定的规则,可以将多种语言解析为类似的通用依赖关系表示,然后,该基于通用依赖分析方式指定的规则可以应用于编写多种语言的文档的情感分析预测。所述监督模式是基于语言表征模型BERT来实现的;对于有监督模式的方面提取,能够运用两种基于BERT的方法:第一种基于BERT的方法称为BERT-NER方法,该方法为:输入文本文档的每个单词被分类为方面或非方面;它能够在句子中找到明确的方面;第二种基于BERT的方法称为BERT多标签分类方法,该方法将文本文档句子中的方面分类为一个或多个预定义的类。对于有监督模式的情绪极性分类,也运用BERT方法进行极性分类。在这种情况下,BERT接收由文本和显式或隐式类的方面组成的双重输入,并将情绪分类为正面,负面或中性类别。所述无监督模式包括基于规则的实现;无监督模式的方面提取是通过处理文本以找到文本中单词的词性,其中词性为名词和复合名词的单词被识别并标记为潜在方面,然后,进行修剪以消除潜在方面列表中的误报,所述修剪包括:删除停用词,意见词,低频词,模糊词以及黑名单词;修剪后剩下的名词被认为是文本的方面;对于无监督模式的情绪极性分类方法,包括使用情感词典,该情感词典包含带注释的单词及其情绪分数,所述情绪分数范围在[-1,1]之间,其中-1为最负数,1为最正数;此外,文本的语法结构被解析,并且查找依赖关系解析中的意见词和显式方面词之间的关系;通过这些关系,可以分配方面的情绪分数。本专利技术的有益效果为:本专利技术的适应性情感分析系统及其方法与现有技术的一般情感分析方法相比具有明显的优势,因为它可以产生关于文档集合的情感的深入细节。此外,将有监督模式与无监督模式的步骤相结合使得适应性情感分析系统及其方法能够找到更多方面,并且可以将两种方法的最佳结合在一起,从而获得高精度的结果。此外,用户可以选择特定于其场景的最佳方面提取方法。最后,实验表明,这样的有监督模式和无监督模式的基于方面的情感分类在情绪极性分类方面具有88%的一致性。附图说明图1为本专利技术的适应性情感分析系统的方法的流程图。具体实施方式由于一般的情绪分析方法不足以进行深入的意见挖掘,本专利技术关注的是一种有针对性的适应性情感分析系统及其方法,也称之为基于方面的情本文档来自技高网...

【技术保护点】
1.一种适应性情感分析系统,包括用于情感分析的终端,其特征在于,所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;所述方面提取模块用于标识要进行情感分析的文本中的方面;所述情感极性分类模块对每个识别出的情感极性进行分类。

【技术特征摘要】
1.一种适应性情感分析系统,包括用于情感分析的终端,其特征在于,所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;所述方面提取模块用于标识要进行情感分析的文本中的方面;所述情感极性分类模块对每个识别出的情感极性进行分类。2.根据权利要求1所述的适应性情感分析系统,其特征在于,所述方面提取模块包括有监督模式的方面提取子模块和无监督模式的方面提取子模块;所述有监督模式的方面提取子模块和无监督模式的方面提取子模块用于对来自文档集合的需要进行情感分析的文本文档提取其方面;所述情感极性分类模块包括有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块;所述有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块用于对方面和需要进行情感分析的文本文档分别进行预测,各自得到每个方面的情绪。3.根据权利要求1所述的适应性情感分析系统,其特征在于,所述用于情感分析的终端还包括并集模块和合并模块;所述并集模块用于通过并集操作方式来合并所提取的方面;所述合并模块用于合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,则最终情绪为中性。4.一种适应性情感分析系统的方法,其特征在于,包括两个子任务,分别如下:(1)方面提取,其标识要进行情感分析的文本中的方面;(2)情感极性分类,其对每个识别出的情感极性进行分类。5.根据权利要求4所述的适应性情感分析系统的方法,其特征在于,所述方面提取和情感极性分类均分为有监督模式和无监督模式,具体方式如下:首先,通过有监督模式的方面提取方法和无监督模式的方面提取方法对来自文档集合的需要进行情感分析的文本文档提取其方面;接着通过并集操作方式来合并所提取的方面;所述方面和需要进行情感分析的文本文档由有监督模式的情感极性分类方法和无监督模式的情感极性分类方法分别进行预测,各自得到每个方面的情绪;然后,合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面...

【专利技术属性】
技术研发人员:庄子琪汉斯·乌思克尔特艾人龙
申请(专利权)人:深巨科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1