一种基于深度学习的方面级情感分析方法及系统技术方案

技术编号:28131247 阅读:48 留言:0更新日期:2021-04-19 11:53
本发明专利技术提供一种基于深度学习的方面级情感分析方法及系统,用情感分析语料训练基于区间特征的方面级情感三元提取模型SUM

【技术实现步骤摘要】
一种基于深度学习的方面级情感分析方法及系统


[0001]本专利技术属于文本情感分析
,特别涉及一种基于深度学习的方面级情感分析方法及系统。

技术介绍

[0002]情感分析也被称为观点挖掘,旨在于研究获取对人物、事件、产品和服务的观点信息,如情感、态度、评估等。文本情感分析是使用自然语言相关技术对带有情感色彩的观点性文本进行处理、归纳、分析和推理。文本情感分析根据研究粒度水平,基本可以分成三种类型:文档级情感分析、句子级情感分析和方面级的情感分析。文档级情感分析或句子级情感分析研究假设整个文档或句子是单个目标实体的描述,通过分析文本回去目标实体的整体情感极性。但在实际情况中,每个实体的各个方面并不能保证是一种的情感极性,即单个句子中或者整个文档有可能会出现多种情感共存的现象。例如餐馆评论句子“Although the service is not good,but I like the food”,正面、负面或中性情感极性都无法准确的描述该评论的情感信息。
[0003]方面级情感分析(Aspect

Based Sentiment Analysis,ABSA)是情感分析中一个更细粒度的研究方向,通过该领域下的各个子任务去分析文本对象实体的方面的情感极性,在方面粒度上描述文本的情感信息。方面级情感分析领域中被广泛关注的任务主要有三种:

方面词提取,指方面级情感分析中情感分析的对象,即情感对象实体的各个方面。

方面情感分类,在得到方面词后对其情感极性进行推断,是方面级情感分析中获取情感信息的关键任务。

观点词提取,即提取对方面词对应的观点词,观点词是直接表现情感的词语,可以作为解释方面词情感推断的原因。方面级情感三元提取(Aspect Sentiment Triplet Extraction,ASTE)联合方面级情感分析领域的三个子任务,得到方面词、情感极性、观点词三元组,从三个角度去全面的描述了情感分析问题,例如,针对条餐馆评论“I hate their service,but their food is great”:首先,提取文本中的“service”方面词与“food”方面词,对应了情感分析的“是什么”问题;其次,推断两个方面的情感极性分别为负面与正面,对应了情感分析的“怎么样”问题;最后,提取两个方面的情感观点词“hate”与“great”,对应了情感分析中“为什么”问题,终得到两个三元组(“service”,负面,“hate”)与(“food”,正面,“great”),三元组每个位置分别对应了方面级情感分析中方面词、情感极性、观点词。
[0004]情感信息不仅能够决定个人的行为,也在一定程度上影响他人的决策。组织机构也可通过分析大众的情感信息了解大众喜恶,进行产品质量分析与服务优化等行动,高效地定位潜在用户人群。伴随着淘宝、Amazon为代表的电商平台以及微博、Facebook等社交平台的快速发展,越来越多的人们选择在网络平台上表达自己的观点,分享生活经验,因此大量带观点的用户数据(user generated content,URG)通过数字化的方式存储下来。一方面,大量的情感数据集为文本情感分析提供了数据支撑,另一方面,由于基于人工或者规则的文本情感分析方法在实际应用场景中的局限性,无法满足个人与组织的实际需求,对文
本情感分析的技术也提出更高的要求与挑战,驱动了文本情感分析向更快更好的方向发展。综上所述,方面级情感分析作为情感分析的重要一部分,是当前自然处理领域内的基础性研究,具有很重要的研究价值和研究意义。目前,方面级情感分析的主流研究方法采用两阶段的管道模型方法,第一阶段提取方面词、方面情感以及观点词,第二阶段对方面与观点词进行配对。管道模型的两个阶段需要构建两个模型,导致整体结构与训练过程都相对复杂,先提取、再配对的处理过程也可能会导致误差的传递,一定程度上影响了方面级情感分析的准确度。同时,之前的专利方法通常使用序列标注的方法来识别情感(例如CN201910324300.8、CN201910798920.5、CN202010362569.8),这些方法在预测方面情感极性可能存在方面中多个词情感不一致的情况。此外,之前的工作未考虑到方面词与观点词之间位置关系,没有有效捕获和利用方面与观点之间关系,导致识别观点词的准确度不高。为了更好地解决这些问题,本专利技术提出了一种基于深度学习的情感学习新方法。

技术实现思路

[0005]本专利技术所要解决的问题是,利用深度学习技术以提高识别文本中方面词、观点词、情感极性的准确度。
[0006]本专利技术的技术方案提供一种基于深度学习的方面级情感分析方法,用情感分析语料训练基于区间特征的方面级情感三元提取模型SUM

ASTE,所述基于区间特征的方面级情感三元提取模型SUM

ASTE包括双层的双向长短期记忆网络BiLSTM,然后用训练后的基于区间特征的方面级情感三元提取模型SUM

ASTE,识别文本包含的情感信息,得到文本的方面词A、观点词O和情感极性E;训练基于区间特征的方面级情感三元提取模型SUM

ASTE的实现过程包括以下步骤,
[0007]步骤1,将文本U作为输入,通过第一层BiLSTM模型得到输入文本中每个词的表示H1,根据H1计算得到文本中的方面词A;
[0008]步骤2,将H1做为第二层BiLSTM的输入,根据第二层BiLSTM模型输出H2、方面词特征T和方面词A与每个词之间的相对距离信息p,融合得到方面词对应的观点词O;
[0009]步骤3,根据第二层BiLSTM模型的输出H2与观点词的注意力特征信息attk,计算得到方面词对应的情感极性E。
[0010]而且,步骤1的实现过程如下,
[0011]在情感分析的文本中,将文本U进行分词后得到长度为N的输入文本I=[x1,x2,...,x
N
],然后使用词嵌入技术得到其相应的词向量序列e=[e1,e2,...,e
N
],e
i
表示第i个词x
i
的词向量,i=1,2,...,N;
[0012]将词向量e输入第一层BiLSTM模型,得到文本中每个词特征表示将词向量e输入第一层BiLSTM模型,得到文本中每个词特征表示表示第一层BLSTM的第i个输出;
[0013]通过对进行激活函数处理,计算得到方面词的概率分布选取最大概率的词作为文本U中的方面词A
i
,得到文本U中的方面词A=[A1,A2,...,A
m
],m表示文本U方面词的个数。
[0014]而且,步骤2的实现过程如下,
[0015]1)将第一层BiLSTM的输出状态H1作为第二层BiLSTM的输入,通过计算得到第二层
网络状的态输出网络状的态输出表示第二层BLSTM的第i个输出;
[0016]根据步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的方面级情感分析方法,其特征在于:用情感分析语料训练基于区间特征的方面级情感三元提取模型SUM

ASTE,所述基于区间特征的方面级情感三元提取模型SUM

ASTE包括双层的双向长短期记忆网络BiLSTM,然后用训练后的基于区间特征的方面级情感三元提取模型SUM

ASTE,识别文本包含的情感信息,得到文本的方面词A、观点词O和情感极性E;训练基于区间特征的方面级情感三元提取模型SUM

ASTE的实现过程包括以下步骤,步骤1,将文本U作为输入,通过第一层BiLSTM模型得到输入文本中每个词的表示H1,根据H1计算得到文本中的方面词A;步骤2,将H1做为第二层BiLSTM的输入,根据第二层BiLSTM模型输出H2、方面词特征T和方面词A与每个词之间的相对距离信息p,融合得到方面词对应的观点词O;步骤3,根据第二层BiLSTM模型的输出H2与观点词的注意力特征信息attk,计算得到方面词对应的情感极性E。2.根据权利要求1所述基于深度学习的方面级情感分析方法,其特征在于:步骤1的实现过程如下,在情感分析的文本中,将文本U进行分词后得到长度为N的输入文本I=[x1,x2,...,x
N
],然后使用词嵌入技术得到其相应的词向量序列e=[e1,e2,...,e
N
],e
i
表示第i个词x
i
的词向量,i=1,2,...,N;将词向量e输入第一层BiLSTM模型,得到文本中每个词特征表示将词向量e输入第一层BiLSTM模型,得到文本中每个词特征表示表示第一层BLSTM的第i个输出;通过对进行激活函数处理,计算得到方面词的概率分布选取最大概率的词作为文本U中的方面词A
i
,得到文本U中的方面词A=[A1,A2,...,A
m
],m表示文本U方面词的个数。3.根据权利要求2所述基于深度学习的方面级情感分析方法,其特征在于:步骤2的实现过程如下,1)将第一层BiLSTM的输出状态H1作为第二层BiLSTM的输入,通过计算得到第二层网络状的态输出状的态输出表示第二层BLSTM的第i个输出;根据步骤1得到的方面词,计算方面词的开始与结束位置上的状态平均值作为方面词的特征表示t
k
,文本中所有的方面词特征表示为T=[t1,t2...,t
m
],k=1,2,...,m;2)获取方面词的相对距离特征,使用词嵌入技术将常数相对距离位置d
k,i
映射得到特征向量p
k,i
;3)融合方面词特征、第二层BiLSTM文本输出词特征和方面词与每个词的相对距离特征,融合得到方面词对应的观点词O。4.根据权利要求3所述基于深度学习的方面级情感分析方法,其特征在于:融合得到方面词对应的观点词O的实现过程如下,面词对...

【专利技术属性】
技术研发人员:何婷婷何军王逾凡范瑞薛昊
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1