【技术实现步骤摘要】
一种情感分析方法、装置和电子设备
本专利技术涉及人工智能领域,尤其涉及一种情感分析方法、装置和电子设备。
技术介绍
近年来,随着互联网的蓬勃发展,人们通过互联网产生的信息正在以指数级爆炸增长。用户每天都会通过互联网,特别是社交媒体网络(如微博、微信公众号、评论性新闻等),产生海量的对人物、事件、产品、公司等带有情感信息的数据。现有的情感分析方法主要是针对篇章、段落和句子级别的文本进行整体的情感倾向挖掘。这种层级的情感分析任务往往会因为情感粒度过粗,缺乏与情感主体的相关性建模,导致分析结果不准且相关度不高。例如,针对“A手机比B手机好用”,整体句子级别的情感为正面情感,但具体到B手机的主体上,实际表达出的情感为负面情感,此时情感倾向的分析不够准确。
技术实现思路
本专利技术实施例提供一种情感分析方法、装置和电子设备,能够准确地确定文本中的主体的情感倾向。为了解决上述技术问题,本专利技术是这样实现的:第一方面,提供了一种情感分析方法,该方法包括:确定待分析文本中的待分析句子;基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;确定所述待分析句子中的情感词以及情感词的极性;利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于 ...
【技术保护点】
1.一种情感分析方法,其特征在于,包括:/n确定待分析文本中的待分析句子;/n基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;/n当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;/n确定所述待分析句子中的情感词以及情感词的极性;/n利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于所述目标主体的情感值;/n合并所述待分析文本中所有匹配到所述目标主体的待分析句子的情感值,确定所述待分析文本对于所述目标主体的情感值。/n
【技术特征摘要】
1.一种情感分析方法,其特征在于,包括:
确定待分析文本中的待分析句子;
基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;
当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;
确定所述待分析句子中的情感词以及情感词的极性;
利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于所述目标主体的情感值;
合并所述待分析文本中所有匹配到所述目标主体的待分析句子的情感值,确定所述待分析文本对于所述目标主体的情感值。
2.如权利要求1所述的方法,其特征在于,确定所述待分析句子中的情感词以及情感词的极性,包括:
基于情感词典,确定所述待分析句子中的情感词以及情感词的极性,所述情感词典中包括多个情感词以及所述多个情感词的极性。
3.如权利要求2所述的方法,其特征在于,基于情感词典,确定所述待分析句子中的情感词以及情感词的极性,包括:
基于所述情感词典,利用多模匹配算法对所述待分析句子进行分词与匹配,以筛选所述待分析的句子中的情感词、触发词以及触发词组,所述情感词典还包括多个触发词以及多个触发词组;
利用预设的触发词与非线性算子的对应关系、及预设的触发词组与非线性算子的对应关系,确定所述触发词对应的第一非线性算子以及所述触发词组对应的第二非线性算子,利用所述第一非线性算子和所述第二非线性算子对所述情感词的极性进行修正,将修正后的情感词的极性作为确定所述待分析句子中的情感词的极性。
4.如权利要求2所述的方法,其特征在于,还包括:
对所述情感词的极性进行非线性累加,以得到所述待分析句子的句子情感值。
5.如权利要求2所述的方法,其特征在于,还包括:
通过搜集公开、监督学习和人工标注的方式,构建所述情感词典。
6.如权利要求1所述的方法,其特征在于,每个主体信息中包括主体名称、以及竞品、主体别名、主体下位词、主体标签与主体类别中的至少一项。
7.如权利要求1所述的方法,其特征在于,基于预设主体信息库,对每个所述待分析句子进行主体匹配之后,还包括:
对主体匹配结果进行主体消歧,以剔除错误的主体匹配结果。
8.如权利要求1所述的方法,其特征在于,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,包括:
对所述待分析句子进行分词,确定所述待分析句子的每个词的词特征,将所述每个词的词特征输入至嵌入层,经过所述嵌入层处理后依次输入第一BI-LSTM层、第二BI-LSTM层,获得每个词对所述目标主体的加权系数,所述主体情感自注意力机制包括:所述嵌入层、所述第一BI-LSTM层、所述第二BI-LSTM层、自注意力层以及所述加权系数。
9.一种情感分析装置,其特征在于,包括:
...
【专利技术属性】
技术研发人员:苏萌,左云鹏,高体伟,苏海波,刘译璟,王勋,孙伟,
申请(专利权)人:北京百分点信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。