一种基于TC-UIE-senMixup的实体关系抽取方法及系统技术方案

技术编号:42634288 阅读:56 留言:0更新日期:2024-09-06 01:33
本发明专利技术涉及文本实体关系抽取技术领域,具体为一种基于TC‑UIE‑senmixup的实体关系抽取方法及系统。包括:S1:获取待处理的专利文本,进行数据预处理,得到采煤机专利摘要文本句子,对得到的摘要文本句子进行少样本的标注,得到已标注的文本句子;S2:搭建实体关系抽取模型;S3:对实体关系抽取模型进行训练、验证以及测试;S4:将采煤机文本摘要句子输入训练好的实体关系抽取模型进行实体关系三元组的抽取,S5:利用抽取出来的实体关系三元组构造采煤机专利设计知识图谱,通过知识图谱将采煤机专利中的异构的设计信息融合成关联的结构化知识网络,实现采煤机专利设计资源信息的可视化与直观理解。

【技术实现步骤摘要】

本专利技术涉及文本实体关系抽取,具体为一种基于tc-uie-senmixup的实体关系抽取方法及系统。


技术介绍

1、随着信息的爆炸增长和信息结构的复杂多样,如何从海量的信息中筛选获取需求的有价值的信息成为了人们需要解决的难题。网络搜索是当今运用最广泛的知识查询手段,但是由于网络检索的单一搜索的局限性以及较差的语义理解能力,很难精准的搜索出想要的知识。随着计算机技术的不断发展,文本挖掘技术不断应用于各大学科领域包括采煤机领域。如何快速准确地从海量文本信息中挖掘出具有价值的知识信息颇具意义。

2、专利作为一种数量可观和格式标准的技术文件,其发布的
技术实现思路
详尽科学、可靠性创新性强,其中记录着大量的技术创新相关知识以及蕴含了规模庞大、结构复杂且语义丰富的特定领域的相关知识,具有极大的挖掘价值。如何对海量的采煤机专利文本展开数据挖掘与知识分析管理是本专利技术需要解决的。

3、目前,针对采煤机领域的专利知识图谱、采煤机设计知识的本体和用于采煤机专利知识抽取的方法和工具相对匮乏。对采煤机专利数据的处理缺乏关注,对采煤机专利知识图谱的构建没有有效本文档来自技高网...

【技术保护点】

1.一种基于TC-UIE-senMixup的实体关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的基于TC-UIE-senMixup的实体关系抽取方法,其特征在于,所述步骤S1包括:

3.根据权利要求2所述的基于TC-UIE-senMixup的实体关系抽取方法,其特征在于,所述步骤S13中本体构建方法:

4.根据权利要求1所述的基于TC-UIE-senMixup的实体关系抽取方法,其特征在于,所述实体关系抽取模型包括:

5.根据权利要求4所述的基于TC-UIE-senMixup的实体关系抽取方法,其特征在于,所述Encoder编码层...

【技术特征摘要】

1.一种基于tc-uie-senmixup的实体关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的基于tc-uie-senmixup的实体关系抽取方法,其特征在于,所述步骤s1包括:

3.根据权利要求2所述的基于tc-uie-senmixup的实体关系抽取方法,其特征在于,所述步骤s13中本体构建方法:

4.根据权利要求1所述的基于tc-uie-senmixup的实体关系抽取方法,其特征在于,所述实体关系抽取模型包括:

5.根据权利要求4所述的基于tc-uie-senmixup的实体关系抽取方法,其特征在于,所述encoder编码层包括6个transformer 编码器叠加组成,每个transformer编码器包括一个multi-head 注意力机制和全连接层。

6.根据权利要求5所述的基于tc-uie-senmixup的实体关系抽取方法,其特征在于,每个multi-head 注意力机制后面接一...

【专利技术属性】
技术研发人员:丁华肖帅鹏杨琨尹东升安志强秦赟
申请(专利权)人:太原理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1