实体关系抽取方法技术

技术编号:39755919 阅读:7 留言:0更新日期:2023-12-17 23:55
本发明专利技术涉及金融科技领域中的人工智能技术,揭露一种实体关系抽取方法,包括:获取待识别句子,利用预训练模型对待识别句子进行文本预测处理,得到预测文本数据;对预测文本数据进行矩阵构建,得到预测向量矩阵,对预测向量矩阵进行特征提取处理,得到句子特征集;基于注意力机制对句子特征集中的句子特征进行注意力提取处理,得到注意力权重矩阵;利用全连接层对所述注意力权重矩阵进行关系提取处理,得到实体关系抽取结果

【技术实现步骤摘要】
实体关系抽取方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种实体关系抽取方法

装置

电子设备及存储介质


技术介绍

[0002]在金融科技领域中,包含大量的金融文献和资料,在不同的金融文献和资料中涉及到多个不同的实体,而抽取不同的实体和实体关系可以有利于更好的查看金融文献和资料

在实体关系抽取任务中,循环神经网络能够学习到高质量的文本信息,在中文和英文自然语言处理任务中都表现出了良好的效果

然而,循环神经网络的计算能力受限于文本序列的长度和表示方式,当处理较长的文本内容时,提取特征的效果可能会受到影响

传统的
CNN
网络通过局部划窗的方式提取文本特征,可能难以捕捉长距离的依赖关系

因此,亟待提出一种准确度更高的实体关系抽取方法


技术实现思路

[0003]本专利技术提供一种实体关系抽取方法

装置

电子设备及存储介质,其主要目的在于提高金融科技领域中实体关系抽取的准确度

[0004]为实现上述目的,本专利技术提供的一种实体关系抽取方法,包括:
[0005]获取待识别句子,利用预训练模型对所述待识别句子进行文本预测处理,得到预测文本数据;
[0006]对所述预测文本数据进行矩阵构建,得到预测向量矩阵,对所述预测向量矩阵进行特征提取处理,得到句子特征集;
[0007]基于注意力机制对所述句子特征集中的句子特征进行注意力提取处理,得到注意力权重矩阵;
[0008]利用全连接层对所述注意力权重矩阵进行关系提取处理,得到实体关系抽取结果

[0009]可选地,所述利用预训练模型对所述待识别句子进行文本预测处理,得到预测文本数据之前,所述方法还包括:
[0010]获取预设业务领域中带有实体标签的句子数据集,并构建
RoBERTa
模型作为初始参考模型;
[0011]利用所述句子数据集对所述初始参考模型进行模型训练处理,得到预训练模型

[0012]可选地,所述利用所述句子数据集对所述初始参考模型进行模型训练处理,得到预训练模型,包括:
[0013]对带有实体标签的句子数据集进行数据预处理,得到标准数据集;
[0014]按照预设划分比例对所述标准数据集进行数据划分,得到训练数据集和测试数据集;
[0015]利用预设标识字符分别对所述训练数据集和所述测试数据集进行字符标识处理,
得到标准训练集和标准测试集;
[0016]将所述标准训练集输入至所述初始参考模型中,得到预测结果;
[0017]根据所述标准测试集和所述预测结果对所述初始参考模型进行模型测试处理,并根据正则化函数进行模型筛选,得到预训练模型

[0018]可选地,所述对所述预测文本数据进行矩阵构建,得到所述预测文本数据对应的向量矩阵,包括:
[0019]将所述预测文本数据拆分为多个字符,并将所述多个字符映射到向量中,得到多个字符向量;
[0020]将所述多个字符向量拼接为向量矩阵,并将所述矩阵作为预测向量矩阵

[0021]可选地,所述对所述预测向量矩阵进行特征提取处理,得到句子特征集,包括:
[0022]获取预构建的特征提取模型,所述特征提取模型由卷积网络层
、Capsule
网络层和分类层构建得到;
[0023]将所述预测向量矩阵输入至所述特征提取模型中,得到句子特征集

[0024]可选地,所述基于注意力机制对所述句子特征集中的句子特征进行注意力提取处理,得到注意力权重矩阵,包括:
[0025]对所述句子特征集中的各个句子特征进行权重分配处理,得到带有权重的句子特征;
[0026]根据所述权重和所述句子特征进行权重计算处理,得到注意力权重矩阵

[0027]可选地,所述利用全连接层对所述注意力权重矩阵进行关系提取处理,得到实体关系抽取结果,包括:
[0028]将所述注意力权重矩阵输入至所述全连接层中,得到对应的概率值;
[0029]将符合预设条件的概率值对应的关系标签作为实体关系结果

[0030]为了解决上述问题,本专利技术还提供一种实体关系抽取装置,所述装置包括:
[0031]文本预测模块,用于获取待识别句子,利用预训练模型对所述待识别句子进行文本预测处理,得到预测文本数据;
[0032]特征提取模块,用于对所述预测文本数据进行矩阵构建,得到预测向量矩阵,对所述预测向量矩阵进行特征提取处理,得到句子特征集;
[0033]注意力提取模块,用于基于注意力机制对所述句子特征集中的句子特征进行注意力提取处理,得到注意力权重矩阵;
[0034]关系提取模块,用于利用全连接层对所述注意力权重矩阵进行关系提取处理,得到实体关系抽取结果

[0035]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0036]至少一个处理器;以及,
[0037]与所述至少一个处理器通信连接的存储器;其中,
[0038]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的实体关系抽取方法

[0039]为了解决上述问题,本专利技术还提供一种存储介质,所述存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的实
体关系抽取方法

[0040]本专利技术实施例中,通过利用预训练模型对所述待识别句子进行文本预测处理,得到预测文本数据,从而实现文本的精准预测,并对预测文本数据对应的预测向量矩阵进行特征提取处理,得到句子特征集,基于注意力机制对所述句子特征集中的句子特征进行注意力提取处理,得到注意力权重矩阵,可以通过注意力机制得到不同权重对应的注意力权重矩阵,并利用全连接层对所述注意力权重矩阵进行关系提取处理,得到准确的实体关系抽取结果

因此本专利技术提出的实体关系抽取方法

装置

电子设备及存储介质,可以解决提高金融科技领域中实体关系抽取的准确度低的问题

附图说明
[0041]图1为本专利技术一实施例提供的实体关系抽取方法的流程示意图;
[0042]图2为图1中其中一个步骤的详细实施流程示意图;
[0043]图3为本专利技术一实施例提供的实体关系抽取装置的功能模块图;
[0044]图4为本专利技术一实施例提供的实现所述实体关系抽取方法的电子设备的结构示意图

[0045]本专利技术目的的实现

功能特点及本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种实体关系抽取方法,其特征在于,所述方法包括:获取待识别句子,利用预训练模型对所述待识别句子进行文本预测处理,得到预测文本数据;对所述预测文本数据进行矩阵构建,得到预测向量矩阵,对所述预测向量矩阵进行特征提取处理,得到句子特征集;基于注意力机制对所述句子特征集中的句子特征进行注意力提取处理,得到注意力权重矩阵;利用全连接层对所述注意力权重矩阵进行关系提取处理,得到实体关系抽取结果
。2.
如权利要求1所述的实体关系抽取方法,其特征在于,所述利用预训练模型对所述待识别句子进行文本预测处理,得到预测文本数据之前,所述方法还包括:获取预设业务领域中带有实体标签的句子数据集,并构建
RoBERTa
模型作为初始参考模型;利用所述句子数据集对所述初始参考模型进行模型训练处理,得到预训练模型
。3.
如权利要求2所述的实体关系抽取方法,其特征在于,所述利用所述句子数据集对所述初始参考模型进行模型训练处理,得到预训练模型,包括:对带有实体标签的句子数据集进行数据预处理,得到标准数据集;按照预设划分比例对所述标准数据集进行数据划分,得到训练数据集和测试数据集;利用预设标识字符分别对所述训练数据集和所述测试数据集进行字符标识处理,得到标准训练集和标准测试集;将所述标准训练集输入至所述初始参考模型中,得到预测结果;根据所述标准测试集和所述预测结果对所述初始参考模型进行模型测试处理,并根据正则化函数进行模型筛选,得到预训练模型
。4.
如权利要求1所述的实体关系抽取方法,其特征在于,所述对所述预测文本数据进行矩阵构建,得到所述预测文本数据对应的向量矩阵,包括:将所述预测文本数据拆分为多个字符,并将所述多个字符映射到向量中,得到多个字符向量;将所述多个字符向量拼接为向量矩阵,并将所述矩阵作为预测向量矩阵
。5.
如权利要求1所述的实体关系抽取方法,其特征在于,所述对所述预测向量矩阵进行特征提取处理,得到句子特征集,包括:获取预构...

【专利技术属性】
技术研发人员:袁美璐
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1