基于字间关系的中文金融评价单元抽取方法技术

技术编号:37821572 阅读:26 留言:0更新日期:2023-06-09 09:57
一种基于字间关系的中文金融评价单元抽取方法,包括:在编码层对中文金融文本句子进行编码,得到字向量;将字向量和字间关系矩阵送入图卷积神经网络模型,对字向量进行评价要素间的汉字关系增强,并对依存关系进行编码;构建评价文本中各字对关系网格,并通过两个单元卷积核对网格中行、列上的词进行差异化;在行、列两个方向上分别使用不同大小的图像卷积核进行卷积运算;对于网格中的元素,融合其在行、列上对应的词编码以及两个词之间的依赖关系编码,通过解码确定元素的标签,完成评价单元抽取。本发明专利技术能够解决评价要素间的汉字关系利用不充分、网格元素表示时没有区分不同评价要素类型、评价要素内的汉字关系利用不充分的问题。问题。问题。

【技术实现步骤摘要】
基于字间关系的中文金融评价单元抽取方法


[0001]本专利技术涉及数据处理
,特别是涉及一种基于字间关系的中文金融评价单元抽取方法。

技术介绍

[0002]近年来,随着互联网以及金融行业的发展,互联网上关于金融信息的内容也越来越丰富,这些内容包含大量带有情感倾向的评论信息,例如互联网用户对某件商品或者金融行业的一些主观看法。随着金融领域的发展与互联网技术的提高,越来越多的金融文本出现在互联网环境中。
[0003]金融文本既包括上市企业自己披露的财务信息和其它非财务信息,又包括影响企业的各种外部环境信息,还有各大机构、专家对企业和外部环境的解读等。金融评论文本中的知识很大程度上可以帮助解读上市企业的经营状况和经营环境,具有非常高的战略价值,对金融评论文本的挖掘工作获得越来越多的关注。
[0004]评价对象

评价词二元组抽取(Aspect

Opinion Pair Extraction)又称为评价单元抽取,是方面级情感分析(Aspect

Based Sentiment本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于字间关系的中文金融评价单元抽取方法,其特征在于,包括以下步骤:在编码层对中文金融文本句子进行编码,得到字向量;基于句法依存关系构建字间关系矩阵,将字向量和字间关系矩阵送入图卷积神经网络模型,对字向量进行评价要素间的汉字关系增强,并对依存关系进行编码;构建评价文本中各字对关系网格,并通过两个单元卷积核对网格中行、列上的词进行差异化,使相同字在充当不同的情感评价要素时具有不同的编码;在行、列两个方向上分别使用不同大小的图像卷积核进行卷积运算,增强情感评价要素内的汉字关系;对于网格中的元素,融合其在行、列上对应的词编码以及两个词之间的依赖关系编码,通过解码确定元素的标签,完成评价单元抽取。2.根据权利要求1所述的基于字间关系的中文金融评价单元抽取方法,其特征在于,基于句法依存关系构建字间关系矩阵,将字向量和字间关系矩阵送入图卷积神经网络模型,对字向量进行评价要素间的汉字关系增强,并对依存关系进行编码的步骤中,采用LAGCN模型学习评价要素间汉字关系,且LAGCN模型满足以下条件式:型学习评价要素间汉字关系,且LAGCN模型满足以下条件式:型学习评价要素间汉字关系,且LAGCN模型满足以下条件式:其中,l为LAGCN层数,表示LAGCN中第l层的第i个字的字向量,表示LAGCN中第(l

1)层的第j个字的字向量,σ表示激活函数,N表示汉字的总数,j表示第j个汉字,表示LAGCN中第l层的第i个字和第j个字之间的邻接强度,表示权重矩阵,b
D
表示偏置矩阵,r
i,j
表示第i个字和第j个字所在词之间的依存关系编码,p
j
表示第i个字所在词的词性编码,d
i,j
∈{0,1},d
i,j
=0时,表示第i个字和第j个字之间不存在句法关联邻接,d
i,j
=1时,表示第i个字和第j个字之间存在句法关联邻接,exp是以自然常数e为底的指数函数,sum表示将向量的每一维度相加,表示邻接张量中的第i行第j列对应的元素,k表示第k个汉字,d
i,k
∈{0,1},d
i,k
=0时,表示第i个字和第k个字之间不存在句法关联邻接,d
i,k
=1时,表示第i个字和第k个字之间存在句法关联邻接,表示邻接张量中的第i行第k列对应的元素,表示权重矩阵,||表示向量连接操作。3.根据权利要求2所述的基于字间关系的中文金融评价单元抽取方法,其特征在于,构建评价文本中各字对关系网格,并通过两个单元卷积核对网格中行、列上的词进行差异化的步骤中,网格G中的元素g
i,j
满足以下条件式:h

=conv

(h
D
)
h

=conv

(h
D
)其中,W
G
表示权重矩阵,为LAGCN中最后一层的conv
′...

【专利技术属性】
技术研发人员:刘德喜陈启
申请(专利权)人:江西财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1