一种情感分析方法、装置和电子设备制造方法及图纸

技术编号:24251986 阅读:19 留言:0更新日期:2020-05-22 23:48
本发明专利技术公开了一种情感分析方法、装置和电子设备,方法包括:确定待分析文本中的待分析句子;基于预设主体信息库,对每个待分析句子进行主体匹配,预设主体信息库中包含多个主体信息;当待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定待分析句子中的每个词对目标主体的加权系数,主体情感自注意力机制结合依存文法建模形成;确定待分析句子中的情感词以及情感词的极性;利用情感词、情感词的极性以及加权系数,确定待分析句子对于目标主体的情感值;合并待分析文本中所有匹配到目标主体的待分析句子的情感值,确定待分析文本对于目标主体的情感值。通过本发明专利技术,能够准确地确定文本中的目标主体的情感倾向。

An emotional analysis method, device and electronic equipment

【技术实现步骤摘要】
一种情感分析方法、装置和电子设备
本专利技术涉及人工智能领域,尤其涉及一种情感分析方法、装置和电子设备。
技术介绍
近年来,随着互联网的蓬勃发展,人们通过互联网产生的信息正在以指数级爆炸增长。用户每天都会通过互联网,特别是社交媒体网络(如微博、微信公众号、评论性新闻等),产生海量的对人物、事件、产品、公司等带有情感信息的数据。现有的情感分析方法主要是针对篇章、段落和句子级别的文本进行整体的情感倾向挖掘。这种层级的情感分析任务往往会因为情感粒度过粗,缺乏与情感主体的相关性建模,导致分析结果不准且相关度不高。例如,针对“A手机比B手机好用”,整体句子级别的情感为正面情感,但具体到B手机的主体上,实际表达出的情感为负面情感,此时情感倾向的分析不够准确。
技术实现思路
本专利技术实施例提供一种情感分析方法、装置和电子设备,能够准确地确定文本中的主体的情感倾向。为了解决上述技术问题,本专利技术是这样实现的:第一方面,提供了一种情感分析方法,该方法包括:确定待分析文本中的待分析句子;基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;确定所述待分析句子中的情感词以及情感词的极性;利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于所述目标主体的情感值;合并所述待分析文本中所有匹配到所述目标主体的待分析句子的情感值,确定所述待分析文本对于所述目标主体的情感值。第二方面,提供了一种情感分析装置,该情感分析装置包括:句子确定模块,用于确定待分析文本中的待分析句子;主体匹配模块,用于基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;加权系数确定模块,用于当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;情感词确定模块,用于确定所述待分析句子中的情感词以及情感词的极性;句子主体情感确定模块,用于利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于所述目标主体的情感值;文本主体情感确定模块,用于合并所述待分析文本中所有匹配到所述目标主体的待分析句子的情感值,确定所述待分析文本对于所述目标主体的情感值。第三方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;所述处理器被配置为:确定待分析文本中的待分析句子;基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;确定所述待分析句子中的情感词以及情感词的极性;利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于所述目标主体的情感值;合并所述待分析文本中所有匹配到所述目标主体的待分析句子的情感值,确定所述待分析文本对于所述目标主体的情感值。在本专利技术实施例中,当待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定待分析句子中的每个词对目标主体的加权系数,且所述主体情感自注意力机制进一步结合依存文法建模形成,另外,能够利用加权系数确定待分析句子中的情感词对于目标主体的情感值,之后,根据所有待分析句子的情感值确定待分析文本对于目标主体的情感值,进而能够精确地确定目标主体与描述词之间的关系,准确地确定待分析文本对于目标主体的情感倾向。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术的一个实施例提供的情感分析方法的流程示意图;图2是本专利技术提供的一种主体知识图谱的示意图;图3是本专利技术的另一个实施例提供的情感分析方法的流程示意图;图4a是本专利技术的一个主体情感自注意力机制的示意图;图4b是本专利技术的一个确定加权系数的示意图;图5是本专利技术的一个实施例提供的情感分析装置的结构示意图;图6是本专利技术的另一个实施例提供的情感分析装置的结构示意图;图7是根据一示例性实施例示出的一种情感分析的电子设备的框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1是本专利技术的一个实施例提供的情感分析方法的流程示意图;如图1所示,情感分析方法可以包括以下步骤:S102、确定待分析文本中的待分析句子。S104、基于预设主体信息库,对每个待分析句子进行主体匹配,预设主体信息库中包含多个主体信息。S106、当待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定待分析句子中的每个词对目标主体的加权系数,所述主体情感自注意力机制进一步结合依存文法建模形成。S108、确定待分析句子中的情感词以及情感词的极性。S110、利用情感词、情感词的极性以及加权系数,确定待分析句子对于目标主体的情感值。S112、合并待分析文本中所有匹配到目标主体的待分析句子的情感值,确定待分析文本对于目标主体的情感值。需要说明的是,在实际应用中,上述S108在S102之后且在S110之前执行即可,本专利技术不限定S108相对于S104、S106执行顺序。本专利技术实施例提供的情感分析方法,当待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定待分析句子中的每个词对目标主体的加权系数,且所述主体情感自注意力机制进一步结合依存文法建模形成,另外,能够利用加权系数确定待分析句子中的情感词对于目标主体的情感值,之后,根据所有待分析句子的情感值确定待分析文本对于目标主体的情感值,进而能够精确地确定目标主体与描述词之间的关系,准确地确定待分析文本对于目标主体的情感倾向。具体的,每个主体信息中包括主体名称、以及竞品、主体别名、主体下位词、主体标签与主体类别中的至少一项。这样,可以精准定义主体,增加了主体匹配的精度与召回,便于更未准确地确定主体的情感倾向。具体的,预设主体信息库可以为主体知识图谱。图2是本专利技术提供的一种主体知识图谱的示意图,图2中以知识图谱的方式记录主体以及与主体相关的主体别名、主体下位词、主体竞品等。具体的,预设主体信息本文档来自技高网...

【技术保护点】
1.一种情感分析方法,其特征在于,包括:/n确定待分析文本中的待分析句子;/n基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;/n当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;/n确定所述待分析句子中的情感词以及情感词的极性;/n利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于所述目标主体的情感值;/n合并所述待分析文本中所有匹配到所述目标主体的待分析句子的情感值,确定所述待分析文本对于所述目标主体的情感值。/n

【技术特征摘要】
1.一种情感分析方法,其特征在于,包括:
确定待分析文本中的待分析句子;
基于预设主体信息库,对每个所述待分析句子进行主体匹配,所述预设主体信息库中包含多个主体信息;
当所述待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,所述主体情感自注意力机制结合依存文法建模形成;
确定所述待分析句子中的情感词以及情感词的极性;
利用所述情感词、所述情感词的极性以及所述加权系数,确定所述待分析句子对于所述目标主体的情感值;
合并所述待分析文本中所有匹配到所述目标主体的待分析句子的情感值,确定所述待分析文本对于所述目标主体的情感值。


2.如权利要求1所述的方法,其特征在于,确定所述待分析句子中的情感词以及情感词的极性,包括:
基于情感词典,确定所述待分析句子中的情感词以及情感词的极性,所述情感词典中包括多个情感词以及所述多个情感词的极性。


3.如权利要求2所述的方法,其特征在于,基于情感词典,确定所述待分析句子中的情感词以及情感词的极性,包括:
基于所述情感词典,利用多模匹配算法对所述待分析句子进行分词与匹配,以筛选所述待分析的句子中的情感词、触发词以及触发词组,所述情感词典还包括多个触发词以及多个触发词组;
利用预设的触发词与非线性算子的对应关系、及预设的触发词组与非线性算子的对应关系,确定所述触发词对应的第一非线性算子以及所述触发词组对应的第二非线性算子,利用所述第一非线性算子和所述第二非线性算子对所述情感词的极性进行修正,将修正后的情感词的极性作为确定所述待分析句子中的情感词的极性。


4.如权利要求2所述的方法,其特征在于,还包括:
对所述情感词的极性进行非线性累加,以得到所述待分析句子的句子情感值。


5.如权利要求2所述的方法,其特征在于,还包括:
通过搜集公开、监督学习和人工标注的方式,构建所述情感词典。


6.如权利要求1所述的方法,其特征在于,每个主体信息中包括主体名称、以及竞品、主体别名、主体下位词、主体标签与主体类别中的至少一项。


7.如权利要求1所述的方法,其特征在于,基于预设主体信息库,对每个所述待分析句子进行主体匹配之后,还包括:
对主体匹配结果进行主体消歧,以剔除错误的主体匹配结果。


8.如权利要求1所述的方法,其特征在于,利用主体情感自注意力机制确定所述待分析句子中的每个词对所述目标主体的加权系数,包括:
对所述待分析句子进行分词,确定所述待分析句子的每个词的词特征,将所述每个词的词特征输入至嵌入层,经过所述嵌入层处理后依次输入第一BI-LSTM层、第二BI-LSTM层,获得每个词对所述目标主体的加权系数,所述主体情感自注意力机制包括:所述嵌入层、所述第一BI-LSTM层、所述第二BI-LSTM层、自注意力层以及所述加权系数。


9.一种情感分析装置,其特征在于,包括:
...

【专利技术属性】
技术研发人员:苏萌左云鹏高体伟苏海波刘译璟王勋孙伟
申请(专利权)人:北京百分点信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1