一种识别信息关系的方法技术

技术编号:39674288 阅读:8 留言:0更新日期:2023-12-11 18:40
本发明专利技术公开了一种识别信息关系的方法

【技术实现步骤摘要】
一种识别信息关系的方法、装置、设备及存储介质


[0001]本专利技术涉及信息处理
,尤其涉及一种识别信息关系的方法

装置

设备及存储介质


技术介绍

[0002]金融领域关系抽取是自然语言处理中的一个重要方向,其可以用于金融风险评估

金融市场监管以及投资决策等方面

其可以从大量的金融文本中提取出重要信息,如实体

关系和事件等,以便进行金融业务的分析

评估和决策

关系抽取具体指的是从自然语言文本中识别出实体之间的语义关系,如从一段文本中抽取(主体

关系和客体)三元组

[0003]目前,主流的关系抽取方法主要分为两类:基于特征工程的方法和基于神经网络的方法

基于特征工程的方法依赖于人工设计的特征和规则,如词性标注

句法分析和依存分析等,来表示实体和关系

基于神经网络的方法利用深度学习模型可以克服特征工程的局限性,提高关系抽取的效果和泛化能力

[0004]由于金融领域的决策需要模型的可解释性来保证决策的准确性和可靠性,但基于神经网络的方法输出的关系识别结果却存在可解释性差的问题


技术实现思路

[0005]本专利技术提供了一种识别信息关系的方法

装置

设备及存储介质,以解决关系识别结果可解释性差的问题

[0006]第一方面,本专利技术提供了一种识别信息关系的方法,包括:
[0007]利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
[0008]利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
[0009]利用所述预设关系识别模型和所述关系置信度,输出目标触发词

所述主体

所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息

[0010]第二方面,本专利技术提供了一种识别信息关系的装置,包括:
[0011]目标信息确定模块,用于利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
[0012]关系置信度确定模块,用于利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
[0013]结果输出模块,用于利用所述预设关系识别模型和所述关系置信度,输出目标触发词

所述主体

所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所
述关系的解释信息,所述目标触发词属于所述目标信息

[0014]第三方面,本专利技术提供了一种电子设备,该电子设备包括:
[0015]至少一个处理器;
[0016]以及与至少一个处理器通信连接的存储器;
[0017]其中,存储器存储有可被至少一个处理器执行的计算机程序,该计算机程序被至少一个处理器执行,以使至少一个处理器能够执行上述第一方面的识别信息关系的方法

[0018]第四方面,本专利技术提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现上述第一方面的识别信息关系的方法

[0019]本专利技术提供的识别信息关系的方案,利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息,利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度,利用所述预设关系识别模型和所述关系置信度,输出目标触发词

所述主体

所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息

通过采用上述技术方案,利用预设关系识别模型对待识别信息中除主体和客体外的信息,进行掩码处理并进行关系类别预测,得到关系置信度,再利用预设关系识别模型和该关系置信度,可以输出主体

客体

主体与客体间的关系以及用于解释该关系的目标触发词,其提高了模型输出的关系识别结果的可解释性,保证了决策者针对待识别信息作决策时的准确性和可靠性

[0020]应当理解,本部分所描述的内容并非旨在标识本专利技术的关键或重要特征,也不用于限制本专利技术的范围

本专利技术的其它特征将通过以下的说明书而变得容易理解

附图说明
[0021]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0022]图1是根据本专利技术实施例一提供的一种识别信息关系的方法的流程图;
[0023]图2是根据本专利技术实施例二提供的一种识别信息关系的方法的流程图;
[0024]图3是根据本专利技术实施例三提供的一种识别信息关系的装置的结构示意图;
[0025]图4是根据本专利技术实施例四提供的一种电子设备的结构示意图

具体实施方式
[0026]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围

[0027]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序

应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施

在本专利技术的描述中,除非另有说明,“多个”是指两个或两个以上
。“和
/
或”,描述关联对象的关联关系,表示可以存在三种关系,例如,
A 和
/
或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种识别信息关系的方法,其特征在于,包括:利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;利用所述预设关系识别模型和所述关系置信度,输出目标触发词

所述主体

所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息
。2.
根据权利要求1所述的方法,其特征在于,所述预设关系识别模型的确定方式,包括:利用初始训练样本,从预设领域数据库中确定扩充训练样本;利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值,并利用所述注意力值和所述扩充训练样本,确定伪标签样本,其中,所述类别表征向量包括所述初始训练样本的样本数据输入预设初始模型的第一子模型后,输出的所述第一类别表征向量以及所述扩充训练样本的样本数据输入预设初始模型的第二子模型后,输出的第二类别表征向量,所述伪标签样本的样本数据属于所述扩充训练样本,所述伪标签样本的标签为所述注意力值;将所述伪标签样本的样本数据输入所述预设初始模型,得到第一输出结果,并根据所述注意力值调整目标权重,其中,所述目标权重为所述预设初始模型的损失函数中所述伪标签样本对应的权重;利用输出结果和调整后的损失函数,确定损失函数值,并利用所述损失函数值确定预设关系识别模型,其中,所述输出结果包括所述第一输出结果和初始训练样本对应的第二输出结果
。3.
根据权利要求2所述的方法,其特征在于,所述利用初始训练样本,从预设领域数据库中确定扩充训练样本,包括以下至少一项:从预设领域数据库中,筛选出包含预设近似关键词和所述初始训练样本的样本数据中的预设关键词一致的数据,得到第一扩充训练样本;从预设领域数据库中,筛选出与初始训练样本的样本数据的编辑距离最小的数据,得到第二扩充训练样本;以及将预设领域数据库中的数据输入所述第一子模型,得到第一文本表征向量,将所述初始训练样本的样本数据输入所述第一子模型,得到第二文本表征向量,并筛选出小于预设值的文本欧式距离对应的所述预设领域数据库中的数据,得到第三扩充训练样本,其中,所述预设近似关键词为所述预设关键词的近似词,所述文本欧式距离为所述第一文本表征向量与所述第一文本表征向量的欧式距离
。4.
根据权利要求2所述的方法,其特征在于,在所述利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值之前,还包括:对所述扩充训练样本的标签进行标签平滑处理,得到平滑后的扩充训练样本;其中,所述利用所述注意力值从所述扩充训练样本中,确定伪标签样本,包括:判断所述...

【专利技术属性】
技术研发人员:梁通王凌云郑玉玲宋丹丹王梓凝刘兆蓬
申请(专利权)人:成方金融科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1