System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种中文实体关系抽取方法、装置、介质及产品制造方法及图纸_技高网

一种中文实体关系抽取方法、装置、介质及产品制造方法及图纸

技术编号:41329326 阅读:4 留言:0更新日期:2024-05-13 15:07
本发明专利技术公开一种中文实体关系抽取方法、装置、介质及产品,涉及人工智能领域,方法包括:构建中文实体关系抽取模型;应用训练集样本对中文实体关系抽取模型进行训练,得到训练好的中文实体关系抽取模型;训练样本集包括中文语句样本和对应的实体关系三元组样本;中文实体关系抽取模型为深度学习模型;将待抽取中文实体关系的中文语句输入至训练好的中文实体关系抽取模型中,得到中文语句的实体关系三元组。本发明专利技术能够提高中文实体关系抽取的准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,特别是涉及一种中文实体关系抽取方法、装置、介质及产品


技术介绍

1、关系抽取是信息抽取的一个关键目标,其输出可以被用于多种下游任务。关系抽取模型可以抽取给定数据中的实体关系三元组,并用于进一步数据分析。然而,在应用预训练模型和考虑汉语多特征等方面,当前的关系抽取模型还需要进一步改进。

2、中文关系抽取任务是当下自然语言处理领域的一个研究热点。在传统中文关系抽取模型的基础上做改进,就需要引入预训练模型并挖掘出更多的汉语特征,实现对关系的准确抽取。

3、中文关系抽取方法从充分应用预训练模型和融合汉语多特征上做了相应的改进,帮助模型在目标域数据集相对不足的情况下仍能得到高质量的嵌入向量,并丰富了嵌入向量中的汉语语义粒度和特征维度。此方法提高了关系抽取模型的准确性。


技术实现思路

1、本专利技术的目的是提供一种中文实体关系抽取方法、装置、介质及产品,能够提高中文实体关系抽取的准确性。

2、为实现上述目的,本专利技术提供了如下方案:

3、一种中文实体关系抽取方法,所述方法包括:

4、构建中文实体关系抽取模型;

5、应用训练集样本对所述中文实体关系抽取模型进行训练,得到训练好的中文实体关系抽取模型;所述训练样本集包括中文语句样本和对应的实体关系三元组样本;所述中文实体关系抽取模型为深度学习模型;

6、将待抽取中文实体关系的中文语句输入至所述训练好的中文实体关系抽取模型中,得到所述中文语句的实体关系三元组。

7、可选地,所述中文实体关系抽取模型包括第一模块、第二模块、第三模块、第四模块、第五模块和第六模块;

8、所述第一模块的输出端与所述第四模块的输入端连接;所述第二模块的输出端与所述第三模块的输入端连接;所述第三模块输出端与所述第四模块的输入端连接;所述第四模块的输出端分别与所述第五模块和所述第六模块的输入端连接;所述第五模块的输出端与所述第六模块的输入端连接;所述第一模块的输入端和所述第二模块的输入端为所述中文实体关系抽取模型的输入端;所述第五模块和所述第六模块的输出端为所述中文实体关系抽取模型的输出端;

9、其中,第一模块为预训练chinesebert模型;所述第二模块为jieba工具包;所述第三模块为预训练skip-gram模型;所述第四模块为依次连接的拼接模块、第一全连接层和bilstm层;所述第五模块为依次连接的第二全连接层和第一sigmoid层;所述第六模块为依次连接的第三全连接层和第二sigmoid层。

10、可选地,所述拼接模块采用横向拼接的方式。

11、可选地,应用训练集样本对所述中文实体关系抽取模型进行训练,得到训练好的中文实体关系抽取模型,具体包括:

12、将中文语句样本输入所述中文实体关系抽取模型,得到实体关系预测三元组;

13、计算所述实体关系预测三元组与实体关系三元组样本之间的联合损失;所述联合损失包括主体预测损失和关系-客体预测损失;

14、根据所述联合损失对所述中文实体关系抽取模型进行训练,得到训练好的中文实体关系抽取模型。

15、可选地,所述主体预测损失和所述关系-客体预测损失均为交叉熵损失函数。

16、可选地,所述联合损失为:

17、losscwtransre=αcrossentropysubject+crossentropyobject-relation;

18、其中,losscwtransre为联合损失,crossentropysubject为主体预测损失;crossentropyobject-relation为关系-客体预测损失;α为crossentropysubject在losscwtransre中所占的权重。α是一个超参数,值可以通过多次实验进行调节。α值越大,那么crossentropysubject占losscwtransre的权重也就越大。

19、一种计算机装置,包括:存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述任一项所述的中文实体关系抽取方法的步骤。

20、一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述的中文实体关系抽取方法的步骤。

21、一种计算机程序产品,包括计算机程序该计算机程序被处理器执行时实现上述任一项所述的中文实体关系抽取方法的步骤。

22、根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:

23、本专利技术提供的中文实体关系抽取方法在充分应用预训练模型和融合汉语多特征上做了相应的改进,使得应用本专利技术构建的模型在目标域数据集相对不足的情况下仍能得到高质量的嵌入向量,并丰富了嵌入向量中的汉语语义粒度和特征维度,提高了应用本专利技术构建的关系抽取模型抽取中文实体关系的准确性。

本文档来自技高网...

【技术保护点】

1.一种中文实体关系抽取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的中文实体关系抽取方法,其特征在于,所述中文实体关系抽取模型包括第一模块、第二模块、第三模块、第四模块、第五模块和第六模块;

3.根据权利要求2所述的中文实体关系抽取方法,其特征在于,所述拼接模块采用横向拼接的方式。

4.根据权利要求1所述的中文实体关系抽取方法,其特征在于,应用训练集样本对所述中文实体关系抽取模型进行训练,得到训练好的中文实体关系抽取模型,具体包括:

5.根据权利要求4所述的中文实体关系抽取方法,其特征在于,所述主体预测损失和所述关系-客体预测损失均为交叉熵损失函数。

6.根据权利要求4所述的中文实体关系抽取方法,其特征在于,所述联合损失为:

7.一种计算机装置,包括:存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-6中任一项所述中文实体关系抽取方法的步骤。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述中文实体关系抽取方法的步骤。

9.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述中文实体关系抽取方法的步骤。

...

【技术特征摘要】

1.一种中文实体关系抽取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的中文实体关系抽取方法,其特征在于,所述中文实体关系抽取模型包括第一模块、第二模块、第三模块、第四模块、第五模块和第六模块;

3.根据权利要求2所述的中文实体关系抽取方法,其特征在于,所述拼接模块采用横向拼接的方式。

4.根据权利要求1所述的中文实体关系抽取方法,其特征在于,应用训练集样本对所述中文实体关系抽取模型进行训练,得到训练好的中文实体关系抽取模型,具体包括:

5.根据权利要求4所述的中文实体关系抽取方法,其特征在于,所述主体预测损失和所述关系-客体预测损失均为交叉熵损...

【专利技术属性】
技术研发人员:程渤章昀恺陈俊亮
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1