一种基于多模型融合的多元关系抽取方法和抽取系统技术方案

技术编号:34601094 阅读:26 留言:0更新日期:2022-08-20 09:03
本发明专利技术公开了一种基于多模型融合的多元关系抽取方法、抽取系统、计算机设备和存储介质,其中一实施例的多元关系抽取方法包括:S1:对输入的文本进行预处理并使用共享编码层进行语义特征提取并输出语义特征向量;S2:分别使用各深度关系模型对所述语义特征向量进行关系抽取并输出关系类型,每个深度关系模型包括用于关系抽取的至少一个关系子模型、以及用于决策并输出关系类型的决策单元;S3:使用关系汇聚单元对各深度关系模型输出的关系类型进行汇聚并生成关系类型结果。本发明专利技术提供的实施例能够快速识别非结构化文档中的实体关系,特别是金融领域的非结构化文档中的实体关系,从而发现其中的风险和机会,具有实际应用价值。值。值。

【技术实现步骤摘要】
一种基于多模型融合的多元关系抽取方法和抽取系统


[0001]本专利技术涉及计算机自然语言处理
,特别是涉及一种基于多模型融合的多元关系抽取方法、多元关系抽取系统、计算机可读存储介质和计算机设备。

技术介绍

[0002]随着深度学习技术的进一步发展,计算机自然语言处理已经成为炙手可热的技术,应用于日常生活的方方面面。具体的,基于实体关系抽取(Relation Extraction,RE)是从文本中抽取出一对实体并给出实体间的关系,例如,在中国专利文件中,一名为《基于深度学习的地铁设计领域规范的实体间关系抽取方法》申请号为CN202110722239.X,介绍了一种基于深度学习的地铁设计领域规范的实体间关系抽取方法,该实体间关系抽取方法采用了一定的输出结构去捕捉存在于句子中的多实体之间的多关系,利用基于实体的掩码信息,屏蔽掉句子中实体之外的部分。同时,将句子中实体的相对位置信息融入到注意力计算过程中,加强了句子中“每个字”的注意力信息。参数选择方面开展了基于迭代次数、学习率、微调使用的BERT层数、最大长度、实体最大距离和最大关系数量等多个超本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多模型融合的多元关系抽取方法,其特征在于,包括:S1:对输入的文本进行预处理并使用共享编码层进行语义特征提取并输出语义特征向量;S2:分别使用各深度关系模型对所述语义特征向量进行关系抽取并输出关系类型,每个深度关系模型包括用于关系抽取的至少一个关系子模型、以及用于决策并输出关系类型的决策单元;S3:使用关系汇聚单元对各深度关系模型输出的关系类型进行汇聚并生成关系类型结果。2.根据权利要求1所述的多元关系抽取方法,其特征在于,所述深度关系模型包括第一关系子模型,所述第一关系子模型包括第一枚举器、第一分类器和第二分类器,所述S1进一步包括:S111:对输入的文本按照字符拆分为多个字输入向量,所述字输入向量包括字向量、段落向量和位置向量;S112:使用共享编码层进行语义特征提取并输出语义特征向量,所述语义特征向量包括第一整体特征向量和多个第二语义特征向量;所述S2进一步包括:S211:使用所述第一枚举器对所述输入的文本进行片段枚举并输出多个第一实体候选片段;S212:使用所述第一分类器分别根据各第一实体候选片段的组合向量和所述第一整体特征向量进行运算并输出多个第一实体向量和多个第一上下文文本特征向量,其中,所述组合向量包括所述第一实体候选片段的文本特征向量、位置向量和宽度向量,所述第一实体向量包括文本特征向量、位置向量和宽度向量;S213:使用所述第二分类器分别根据所述多个第一实体向量和所述多个第一上下文文本特征向量进行运算并输出第一关系类型。3.根据权利要求2所述的多元关系抽取方法,其特征在于,所述S212进一步包括:S2121:使用所述第一分类器分别根据各第一实体候选片段的组合向量和所述第一整体特征向量进行运算生成第一候选实体;S2122:使用Softmax判断所述第一候选实体是否为实体,若所述第一候选实体为实体则输出第一实体向量;所述S213进一步包括:使用所述第二分类器分别根据所述多个第一实体向量中的两个第一实体向量、以及所述两个第一实体向量之间的所述第一上下文文本特征向量进行两两关系分类并生成对应的第一关系类型。4.根据权利要求2所述的多元关系抽取方法,其特征在于,所述第一关系子模型的损失函数为所述第一分类器的损失函数和所述第二分类器的损失函数的加权平均。5.根据权利要求2所述的多元关系抽取方法,其特征在于,所述深度关系模型包括第二关系子模型,所述第二关系子模型包括条件随机场模型、第三分类器和第四分类器,所述S2进一步包括:S221:使用所述条件随机场模型根据所述语义特征向量进行路径判断并输出识别的多
个第二实体向量;S222:使用所述第三分类器对所述...

【专利技术属性】
技术研发人员:蔡传宏胡沛弦
申请(专利权)人:华能贵诚信托有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1