【技术实现步骤摘要】
一种基于深度学习的方面级情感分析方法及系统
[0001]本专利技术属于文本情感分析
,特别涉及一种基于深度学习的方面级情感分析方法及系统。
技术介绍
[0002]情感分析也被称为观点挖掘,旨在于研究获取对人物、事件、产品和服务的观点信息,如情感、态度、评估等。文本情感分析是使用自然语言相关技术对带有情感色彩的观点性文本进行处理、归纳、分析和推理。文本情感分析根据研究粒度水平,基本可以分成三种类型:文档级情感分析、句子级情感分析和方面级的情感分析。文档级情感分析或句子级情感分析研究假设整个文档或句子是单个目标实体的描述,通过分析文本回去目标实体的整体情感极性。但在实际情况中,每个实体的各个方面并不能保证是一种的情感极性,即单个句子中或者整个文档有可能会出现多种情感共存的现象。例如餐馆评论句子“Although the service is not good,but I like the food”,正面、负面或中性情感极性都无法准确的描述该评论的情感信息。
[0003]方面级情感分析(Aspect
‑
Based Sentiment Analysis,ABSA)是情感分析中一个更细粒度的研究方向,通过该领域下的各个子任务去分析文本对象实体的方面的情感极性,在方面粒度上描述文本的情感信息。方面级情感分析领域中被广泛关注的任务主要有三种:
①
方面词提取,指方面级情感分析中情感分析的对象,即情感对象实体的各个方面。
②
方面情感分类,在得到方面词后对其情感极性进 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的方面级情感分析方法,其特征在于:用情感分析语料训练基于区间特征的方面级情感三元提取模型SUM
‑
ASTE,所述基于区间特征的方面级情感三元提取模型SUM
‑
ASTE包括双层的双向长短期记忆网络BiLSTM,然后用训练后的基于区间特征的方面级情感三元提取模型SUM
‑
ASTE,识别文本包含的情感信息,得到文本的方面词A、观点词O和情感极性E;训练基于区间特征的方面级情感三元提取模型SUM
‑
ASTE的实现过程包括以下步骤,步骤1,将文本U作为输入,通过第一层BiLSTM模型得到输入文本中每个词的表示H1,根据H1计算得到文本中的方面词A;步骤2,将H1做为第二层BiLSTM的输入,根据第二层BiLSTM模型输出H2、方面词特征T和方面词A与每个词之间的相对距离信息p,融合得到方面词对应的观点词O;步骤3,根据第二层BiLSTM模型的输出H2与观点词的注意力特征信息attk,计算得到方面词对应的情感极性E。2.根据权利要求1所述基于深度学习的方面级情感分析方法,其特征在于:步骤1的实现过程如下,在情感分析的文本中,将文本U进行分词后得到长度为N的输入文本I=[x1,x2,...,x
N
],然后使用词嵌入技术得到其相应的词向量序列e=[e1,e2,...,e
N
],e
i
表示第i个词x
i
的词向量,i=1,2,...,N;将词向量e输入第一层BiLSTM模型,得到文本中每个词特征表示将词向量e输入第一层BiLSTM模型,得到文本中每个词特征表示表示第一层BLSTM的第i个输出;通过对进行激活函数处理,计算得到方面词的概率分布选取最大概率的词作为文本U中的方面词A
i
,得到文本U中的方面词A=[A1,A2,...,A
m
],m表示文本U方面词的个数。3.根据权利要求2所述基于深度学习的方面级情感分析方法,其特征在于:步骤2的实现过程如下,1)将第一层BiLSTM的输出状态H1作为第二层BiLSTM的输入,通过计算得到第二层网络状的态输出状的态输出表示第二层BLSTM的第i个输出;根据步骤1得到的方面词,计算方面词的开始与结束位置上的状态平均值作为方面词的特征表示t
k
,文本中所有的方面词特征表示为T=[t1,t2...,t
m
],k=1,2,...,m;2)获取方面词的相对距离特征,使用词嵌入技术将常数相对距离位置d
k,i
映射得到特征向量p
k,i
;3)融合方面词特征、第二层BiLSTM文本输出词特征和方面词与每个词的相对距离特征,融合得到方面词对应的观点词O。4.根据权利要求3所述基于深度学习的方面级情感分析方法,其特征在于:融合得到方面词对应的观点词O的实现过程如下,面词对...
【专利技术属性】
技术研发人员:何婷婷,何军,王逾凡,范瑞,薛昊,
申请(专利权)人:华中师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。