基于预训练语言模型提示微调的开放知识图谱补全方法、装置制造方法及图纸

技术编号:41113364 阅读:23 留言:0更新日期:2024-04-25 14:04
本发明专利技术提供了基于预训练语言模型提示微调的开放知识图谱补全方法,其充分利用预训练语言模型中的开放知识来协助知识图谱补全,方法包括提取所有关系并构造关系特定模板,根据关系特定模板将三元组数据转换成自然语言句子,采用分词器处理成token序列并采用token[MASK]来替换尾实体;获得缺失尾实体的三元组的头实体h的邻居三元组集合,将邻居三元组中的尾实体替换成token[MASK],输入编码器获得头实体h的邻居嵌入向量;设置软token[con]作为软连接符,以形成整体的软提示,基于Bert模型和MLP网络构建尾实体预测模型,将构建的整体的软提示输入最优的尾实体预测模型,输出尾实体以补全知识图谱。

【技术实现步骤摘要】

本专利技术涉及网络知识图谱、数据挖掘领域,基于预训练语言模型提示微调的开放知识图谱补全方法、装置


技术介绍

1、鉴于新概念和新实体的持续和快速出现,现实世界中的知识图谱通常是不完整的,通过人工注释按时保持现有知识图谱的完整性是非常昂贵的。开放知识图谱补全任务(open knowledge graph completion,okgc)旨利用外部资源中的大量开放知识,来补全现有知识图谱中缺失的事实,这对于促进现有kg的自动构建、扩展和完备性以提高下游任务性能至关重要。

2、领域知识图谱是特定行业知识与应用的较小规模的领域图谱,典型应用场景有国防、金融、公安、工业等,领域知识图谱由于可以深度建模领域知识,更紧密地支撑复杂业务,近年来成为ai落地的热点之一。在复杂度高的行业场景中,领域知识图谱将借助于其天然的知识可解释性和预测等技术方向的优势,在解决实际业务问题、辅助智能决策方向上发挥巨大作用。

3、然而,研发领域知识图谱,并在实际应用场景中部署和使用仍面临着:构建前,复杂领域场景涉及到的知识维度广,业务专家短时间内难以构建出完备的领域s本文档来自技高网...

【技术保护点】

1.基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于,在步骤1中,具体包括以下步骤:

3.根据权利要求2所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于:所述的预训练语言模型的分词器采用Tokenizer分词器。

4.根据权利要求2所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于:所述关系特定模板通过大语言模型获得。

5.根据权利要求2所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其...

【技术特征摘要】

1.基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于,在步骤1中,具体包括以下步骤:

3.根据权利要求2所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于:所述的预训练语言模型的分词器采用tokenizer分词器。

4.根据权利要求2所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于:所述关系特定模板通过大语言模型获得。

5.根据权利要求2所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于:在步骤2中,具体包括以下步骤:

6.根据权利要求5所述的基于预训练语言模型提示微调的开放知识图谱补全方法,其特征在于:在步骤3中,自定义的软token为连接词,软token的...

【专利技术属性】
技术研发人员:周斌宋鑫王晔汪海洋黄颜熠田磊谢锋高立群丁锐东李爱平江荣涂宏魁
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1