文档的情感识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38729234 阅读:15 留言:0更新日期:2023-09-08 23:19
本发明专利技术提供一种文档的情感识别方法、装置、电子设备及存储介质,其中该方法包括:抽取文档中的至少一组相互对应的观点对象和观点描述;选取出至少一组观点对象和观点描述中的至少一个目标观点,目标观点包括相互对应的目标观点对象和目标观点描述;基于至少一个目标观点的文本内容,分别赋予至少一个目标观点对应的观点分值;通过预先训练的概率图模型确定至少一个目标观点对应的权重,根据至少一个观点分值和至少一个权重计算文档的情感分值。本发明专利技术解决了文档的情感识别仅对核心观点进行简单分类,未能够充分考虑各核心观点之间的相互影响,导致文档的情感识别无法准确反映真实情感的情况。情感的情况。情感的情况。

【技术实现步骤摘要】
文档的情感识别方法、装置、电子设备及存储介质


[0001]本专利技术属于文本分析
,具体涉及文档的情感识别方法、文档的情感识别装置、电子设备及存储介质。

技术介绍

[0002]当前的文本情感识别方案基本上是采用文本分类的模型,对一段文本进行情绪分类。而行业的研究报告,是各行业的专业人士,对一些行业现象或政策,进行的深度分析。其情绪倾向,反映了行业人员对某个对象的乐观或悲观估计,有着强烈的指导意义。因而,研报的情感判断具有极大的价值。现有的分类方式,虽然可以用于绝大部分分类的场景,但是在研报中,有些独有的表达结构,如果直接使用全文进行情感判断,往往指导意义不大,且容易判断错误。研报中,每个段落会描述不同的核心观点。因而,不同的核心观点极有可能包含不同的情感趋势。在计算研报的整体情感时,简单地将核心观点进行文本合并,然后通过分类模型,会忽略掉不同观点的情绪差异。

技术实现思路

[0003]本专利技术所要解决的技术问题在于,提供一种文档的情感识别方法、文档的情感识别装置、电子设备及存储介质,以解决文档的情感识别仅对核心观点进行简单分类,未能够充分考虑各核心观点之间的相互影响,导致文档的情感识别无法准确反映真实情感的情况。
[0004]为了解决或者一定程度上改善上述技术问题,根据本专利技术一方面,提供一种文档的情感识别方法,包括:
[0005]抽取所述文档中的至少一组相互对应的观点对象和观点描述;
[0006]选取出至少一组所述观点对象和所述观点描述中的至少一个目标观点,所述目标观点包括相互对应的目标观点对象和目标观点描述;
[0007]基于至少一个所述目标观点的文本内容,分别赋予至少一个所述目标观点对应的观点分值;
[0008]通过预先训练的概率图模型确定至少一个所述目标观点对应的权重,根据至少一个所述观点分值和至少一个所述权重计算所述文档的情感分值。
[0009]在一些实施方式中,至少一组所述观点对象和所述观点描述的抽取基于观点抽取模型,所述观点抽取模型包括:第一阅读理解模块和第二阅读理解模块;
[0010]所述抽取所述文档中的至少一组相互对应的观点对象和观点描述的步骤,包括:
[0011]将所述文档的文本内容分别输入所述第一阅读理解模块和所述第二阅读理解模块内;
[0012]基于所述第一阅读理解模块内的观点对象模板抽取出所述文档内的至少一个所述观点对象;
[0013]将至少一个所述观点对象和所述观点对象的文本内容输入所述第二阅读理解模
块内,结合所述第二阅读理解模块内的观点描述模板,抽取出至少一个所述观点对象对应的至少一个所述观点描述。
[0014]在一些实施方式中,所述观点抽取模型还包括第一多注意力模块和第二多注意力模块;
[0015]所述选取出至少一组所述观点对象和所述观点描述中的至少一个目标观点的步骤,包括:
[0016]将至少一个所述观点对象输入所述第一多注意力模块,基于所述第一多注意力模块内的目标观点矩阵选取出至少一个所述观点对象中的至少一个所述目标观点对象和所述目标观点对象的文本位置;
[0017]将至少一个所述目标观点对象、所述文本位置和所述至少一个所述观点描述输入所述第二多注意力模块,基于所述文本位置确定出至少一个所述观点描述中,与至少一个所述目标观点对象对应的至少一个所述目标观点描述。
[0018]在一些实施方式中,所述观点抽取模型的训练损失为观点对象的训练损失和观点描述的训练损失之和。
[0019]在一些实施方式中,所述基于至少一个所述目标观点的文本内容,分别赋予至少一个所述目标观点对应的观点分值的步骤,包括:
[0020]将至少一个所述目标观点的文本内容输入到预先训练的文本分类模型,以对至少一个所述目标观点进行分类;
[0021]基于预先设置的类别与分值的对应关系,根据至少一个所述目标观点的类别,分别赋予对应的所述观点分值。
[0022]在一些实施方式中,所述概率图模型的预先训练的步骤,包括:
[0023]基于多个文档中每个文档的至少一个目标观点创建概率图,其中所述目标观点包括相互对应的目标观点对象和目标观点描述,所述概率图中的每个节点为一个目标观点和观点分值;
[0024]当多个节点的目标观点和观点分值相同时,则将所述多个节点进行合并;
[0025]分别赋予每个所述文档对应的情感分值,并通过节点对出现的次数、每个文档的所述情感分值及每个目标观点的观点分值计算出节点的边的权重,所述节点对为有边连接的两个节点。
[0026]在一些实施方式中,所述通过预先训练的概率图模型确定至少一个所述目标观点分别对应的权重,根据至少一个所述观点分值和至少一个所述权重计算所述文档的情感分值的步骤,包括:
[0027]将至少一个所述目标观点输入预先训练的概率图模型,确定出至少一个所述目标观点对应的节点;
[0028]分别将至少一个所述目标观点的所述观点分值与所述对应的节点的边的权重相乘后求和,计算出所述文档的所述情感分值。
[0029]根据本专利技术的另一方面,提供一种文档的情感识别装置,包括:
[0030]抽取模块,配置为抽取所述文档中的至少一组相互对应的观点对象和观点描述;
[0031]选取模块,配置为选取出至少一组所述观点对象和所述观点描述中的至少一个目标观点,所述目标观点包括相互对应的目标观点对象和目标观点描述;
[0032]赋值模块,配置为基于至少一个所述目标观点的文本内容,分别赋予至少一个所述目标观点对应的观点分值;
[0033]计算模块,配置为通过预先训练的概率图模型确定至少一个所述目标观点分别对应的权重,根据至少一个所述观点分值和至少一个所述权重计算所述文档的情感分值。
[0034]在一些实施方式中,至少一组所述观点对象和所述观点描述的抽取基于观点抽取模型,所述观点抽取模型包括:第一阅读理解模块和第二阅读理解模块;
[0035]所述抽取模块具体配置为:
[0036]将所述文档的文本内容分别输入所述第一阅读理解模块和所述第二阅读理解模块内;
[0037]基于所述第一阅读理解模块内的观点对象模板抽取出所述文档内的至少一个所述观点对象;
[0038]将至少一个所述观点对象和所述观点对象的文本内容输入所述第二阅读理解模块内,结合所述第二阅读理解模块内的观点描述模板,抽取出至少一个所述观点对象对应的至少一个所述观点描述。
[0039]在一些实施方式中,所述观点抽取模型还包括第一多注意力模块和第二多注意力模块;
[0040]所述选取模块具体配置为:
[0041]将至少一个所述观点对象输入所述第一多注意力模块,基于所述第一多注意力模块内的目标观点矩阵选取出至少一个所述观点对象中的至少一个所述目标观点对象和所述目标观点对象的文本位置;
[0042]将至少一个所述目标观点对象、所述文本位置和所述至少一个所述观点描述输入所述第二多注意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档的情感识别方法,其特征在于,包括:抽取所述文档中的至少一组相互对应的观点对象和观点描述;选取出至少一组所述观点对象和所述观点描述中的至少一个目标观点,所述目标观点包括相互对应的目标观点对象和目标观点描述;基于至少一个所述目标观点的文本内容,分别赋予至少一个所述目标观点对应的观点分值;通过预先训练的概率图模型确定至少一个所述目标观点对应的权重,根据至少一个所述观点分值和至少一个所述权重计算所述文档的情感分值。2.根据权利要求1所述的文档的情感识别方法,其特征在于,至少一组所述观点对象和所述观点描述的抽取基于观点抽取模型,所述观点抽取模型包括:第一阅读理解模块和第二阅读理解模块;所述抽取所述文档中的至少一组相互对应的观点对象和观点描述的步骤,包括:将所述文档的文本内容分别输入所述第一阅读理解模块和所述第二阅读理解模块内;基于所述第一阅读理解模块内的观点对象模板抽取出所述文档内的至少一个所述观点对象;将至少一个所述观点对象和所述观点对象的文本内容输入所述第二阅读理解模块内,结合所述第二阅读理解模块内的观点描述模板,抽取出至少一个所述观点对象对应的至少一个所述观点描述。3.根据权利要求2所述的文档的情感识别方法,其特征在于,所述观点抽取模型还包括第一多注意力模块和第二多注意力模块;所述选取出至少一组所述观点对象和所述观点描述中的至少一个目标观点的步骤,包括:将至少一个所述观点对象输入所述第一多注意力模块,基于所述第一多注意力模块内的目标观点矩阵选取出至少一个所述观点对象中的至少一个所述目标观点对象和所述目标观点对象的文本位置;将至少一个所述目标观点对象、所述文本位置和所述至少一个所述观点描述输入所述第二多注意力模块,基于所述文本位置确定出至少一个所述观点描述中,与至少一个所述目标观点对象对应的至少一个所述目标观点描述。4.根据权利要求3所述的文档的情感识别方法,其特征在于,所述观点抽取模型的训练损失为观点对象的训练损失和观点描述的训练损失之和。5.根据权利要求1

4中任一项所述的文档的情感识别方法,其特征在于,所述基于至少一个所述目标观点的文本内容,分别赋予至少一个所述目标观点对应的观点分值的步骤,包括:将至少一个所述目标观点的文本内容输入到预先训练的文本分类模型,以对至少一个所述目标观点进行分类;基于预先...

【专利技术属性】
技术研发人员:李伟张恒
申请(专利权)人:通联数据股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1