【技术实现步骤摘要】
一种识别信息关系的方法、装置、设备及存储介质
[0001]本专利技术涉及信息处理
,尤其涉及一种识别信息关系的方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]金融领域关系抽取是自然语言处理中的一个重要方向,其可以用于金融风险评估
、
金融市场监管以及投资决策等方面
。
其可以从大量的金融文本中提取出重要信息,如实体
、
关系和事件等,以便进行金融业务的分析
、
评估和决策
。
关系抽取具体指的是从自然语言文本中识别出实体之间的语义关系,如从一段文本中抽取(主体
、
关系和客体)三元组
。
[0003]目前,主流的关系抽取方法主要分为两类:基于特征工程的方法和基于神经网络的方法
。
基于特征工程的方法依赖于人工设计的特征和规则,如词性标注
、
句法分析和依存分析等,来表示实体和关系
。
基于神经网络的方法利用深度学习模型可以克服特征工程的局限性,提高关系抽取的效果和泛化能力
。
[0004]由于金融领域的决策需要模型的可解释性来保证决策的准确性和可靠性,但基于神经网络的方法输出的关系识别结果却存在可解释性差的问题
。
技术实现思路
[0005]本专利技术提供了一种识别信息关系的方法
、
装置
、
设备及存储介质,以解决关系识别结果可 ...
【技术保护点】
【技术特征摘要】
1.
一种识别信息关系的方法,其特征在于,包括:利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;利用所述预设关系识别模型和所述关系置信度,输出目标触发词
、
所述主体
、
所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息
。2.
根据权利要求1所述的方法,其特征在于,所述预设关系识别模型的确定方式,包括:利用初始训练样本,从预设领域数据库中确定扩充训练样本;利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值,并利用所述注意力值和所述扩充训练样本,确定伪标签样本,其中,所述类别表征向量包括所述初始训练样本的样本数据输入预设初始模型的第一子模型后,输出的所述第一类别表征向量以及所述扩充训练样本的样本数据输入预设初始模型的第二子模型后,输出的第二类别表征向量,所述伪标签样本的样本数据属于所述扩充训练样本,所述伪标签样本的标签为所述注意力值;将所述伪标签样本的样本数据输入所述预设初始模型,得到第一输出结果,并根据所述注意力值调整目标权重,其中,所述目标权重为所述预设初始模型的损失函数中所述伪标签样本对应的权重;利用输出结果和调整后的损失函数,确定损失函数值,并利用所述损失函数值确定预设关系识别模型,其中,所述输出结果包括所述第一输出结果和初始训练样本对应的第二输出结果
。3.
根据权利要求2所述的方法,其特征在于,所述利用初始训练样本,从预设领域数据库中确定扩充训练样本,包括以下至少一项:从预设领域数据库中,筛选出包含预设近似关键词和所述初始训练样本的样本数据中的预设关键词一致的数据,得到第一扩充训练样本;从预设领域数据库中,筛选出与初始训练样本的样本数据的编辑距离最小的数据,得到第二扩充训练样本;以及将预设领域数据库中的数据输入所述第一子模型,得到第一文本表征向量,将所述初始训练样本的样本数据输入所述第一子模型,得到第二文本表征向量,并筛选出小于预设值的文本欧式距离对应的所述预设领域数据库中的数据,得到第三扩充训练样本,其中,所述预设近似关键词为所述预设关键词的近似词,所述文本欧式距离为所述第一文本表征向量与所述第一文本表征向量的欧式距离
。4.
根据权利要求2所述的方法,其特征在于,在所述利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值之前,还包括:对所述扩充训练样本的标签进行标签平滑处理,得到平滑后的扩充训练样本;其中,所述利用所述注意力值从所述扩充训练样本中,确定伪标签样本,包括:判断所述...
【专利技术属性】
技术研发人员:梁通,王凌云,郑玉玲,宋丹丹,王梓凝,刘兆蓬,
申请(专利权)人:成方金融科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。