一种中文装备故障模式实体关系抽取方法、装置及设备制造方法及图纸

技术编号:42879259 阅读:19 留言:0更新日期:2024-09-30 15:03
本申请涉及一种中文装备故障模式实体关系抽取方法、装置及设备。所述方法包括:构建中文装备故障模式实体关系抽取模型;其中,中文装备故障模式实体关系抽取模型由嵌入向量生成模块、局部特征初步抽取模块、局部与全局特征迭代抽取模块以及实体关系三元组生成模块组成;应用训练样本集对中文装备故障模式实体关系抽取模型进行训练,得到训练好的中文装备故障模式实体关系抽取模型;将装备故障模式中待抽取中文实体关系的中文语句输入至训练好的中文装备故障模式实体关系抽取模型中,得到中文语句的实体关系预测三元组。采用本方法能够提高中文装备故障模式文本数据实体关系抽取的准确性。

【技术实现步骤摘要】

本申请涉及实体关系抽取,特别是涉及一种中文装备故障模式实体关系抽取方法、装置及设备


技术介绍

1、实体关系抽取是自然语言处理中的一个任务,旨在从文本中识别实体之间的语义关系,形成实体关系三元组,通常以主体、关系、客体的形式呈现。在信息检索、知识图谱构建、文本挖掘等领域实体关系抽取是非常重要的一个环节。

2、中文装备故障模式文本数据的实体关系抽取任务是当下自然语言处理领域的一个研究热点。然而,现有实体关系抽取方法由于并未充分挖掘中文装备故障模式文本数据的汉语多特征信息,在中文装备故障模式文本数据集相对不足的情况时,难以实现实体关系的准确抽取。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种中文装备故障模式实体关系抽取方法、装置及设备。

2、一种中文装备故障模式实体关系抽取方法,所述方法包括:

3、构建中文装备故障模式实体关系抽取模型;其中,中文装备故障模式实体关系抽取模型由嵌入向量生成模块、局部特征初步抽取模块、局部与全局特征迭代抽取模块以及实体关系三元组生成模本文档来自技高网...

【技术保护点】

1.一种中文装备故障模式实体关系抽取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述嵌入向量生成模块为所述中文装备故障模式实体关系抽取模型的第一模块,所述局部特征初步抽取模块为所述中文装备故障模式实体关系抽取模型的第二模块,所述局部与全局特征迭代抽取模块包含所述中文装备故障模式实体关系抽取模型的第三模块、第四模块和第五模块,所述实体关系三元组生成模块为所述中文装备故障模式实体关系抽取模型的第六模块;

3.根据权利要求2所述的方法,其特征在于,所述第一模块为预训练ChineseBERT模型,所述预训练ChineseBERT模型用于生成...

【技术特征摘要】

1.一种中文装备故障模式实体关系抽取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述嵌入向量生成模块为所述中文装备故障模式实体关系抽取模型的第一模块,所述局部特征初步抽取模块为所述中文装备故障模式实体关系抽取模型的第二模块,所述局部与全局特征迭代抽取模块包含所述中文装备故障模式实体关系抽取模型的第三模块、第四模块和第五模块,所述实体关系三元组生成模块为所述中文装备故障模式实体关系抽取模型的第六模块;

3.根据权利要求2所述的方法,其特征在于,所述第一模块为预训练chinesebert模型,所述预训练chinesebert模型用于生成输入的中文语句的汉字粒度嵌入向量,并将所述汉字粒度嵌入向量输出至所述第二模块输入端;其中,所述汉字粒度嵌入向量由拼音和字符组成;其中,输入的中文语句中第i个汉字ci对应的汉字粒度嵌入向量表示为

4.根据权利要求2所述的方法,其特征在于,所述第二模块为bilstm模型,所述bilstm模型用于采用前向后向计算方式,对所述第一模块输出的汉字粒度嵌入向量进行主客体局部关联初步抽取,得到初步抽取的主体特征与客体特征,并输出至所述第三模块输入端;

5.根据权利要求2所述的方法,其特征在于,所述第三模块由第一全连接层组成,第一全连接层用于根据所述第二模块输出的初步抽取的主体特征与客体特征,为每个关系生成一个表格标签特征,并在主客体特征迭代抽取完成之前,将所述表格标签特征输出至所述第四模块输入端;在主客体特征迭代抽取完成之后,将最后一次迭代生成的表格标签特征输出至所述第六模块输入端;

6.根据权利要求2所述的方法,其特征在于,所述第四模块由依次连接的拼接模块、多头自注意力层、多头注意力层和第二全连接层组成;所述拼接模块用于对多头自注意力层、多头注意力层和第二全连接层...

【专利技术属性】
技术研发人员:李磊陈梦樵邢臣旭张士刚罗旭杨拥民方永轩
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1