一种知识图谱自动补全和更新的方法技术

技术编号：34885948 阅读：57 留言：0更新日期：2022-09-10 13:43

本发明专利技术公开了一种知识图谱自动补全和更新的方法，涉及了人工智能以及自然语言处理领域。本发明专利技术通过处理原始数据构建知识图谱和用于文本生成的神经网络模型，将知识图谱中相近的实体和关系或者知识图谱中缺失的三元组作为模型的输入，利用神经网络模型的输出更新存储到图数据库中达到知识图谱自动补全和更新的目的。本发明专利技术实现了智能问答领域的知识图谱中的三元组信息的补全和自动更新，可以为应用知识图谱的后续分析提供支撑。知识图谱的后续分析提供支撑。知识图谱的后续分析提供支撑。

全部详细技术资料下载

【技术实现步骤摘要】
一种知识图谱自动补全和更新的方法

[0001]本专利技术涉及了人工智能以及自然语言处理领域，通过将知识图谱(KnowledgeGraph)与基于自然语言处理领域(NaturalLanguageProcessing)的文本生成技术相结合，提出了一种知识图谱自动补全和更新的方法。

技术介绍

[0002]随着人工智能技术发展，许多优秀的技术被提出，整个领域取得了迅猛的发展。知识图谱(KnowledgeGraph)的概念在2012年由谷歌提出，其本质是结构化的语义网络，是一种以节点和边的形式将不同类型的实体、概念有结构地组合构成的图数据结构，其初期目的是为了提高搜索引擎的搜索质量以提升用户体验。而随着大数据技术的发展，互联网中的信息数据规模已经达到了难以估量的程度。因此，知识图谱还能用于很好的组织和管理互联网信息。作为一种新型的数据表示方式，其基本结构由“实体
‑
关系
‑
实体”和“实体
‑
属性
‑
属性值”两种三元组形式组成，由于其特性，知识图谱目前被广泛运用在搜索、问答、个性化推荐等领域，同时也被广泛运用到了金融、保险、医疗以及移动电子商务等各个领域。
[0003]文本生成技术是一类宏观的深度学习技术，发展出了一系列通用的模型，如Seq2Seq模型、Attention机制、变分自编码器等。许多针对文本生成技术的研究是在具体的任务中进行的，典型的任务包括机器翻译、文本摘要、自动评论、对话系统等。在具体任务中的文本生成模型往往以通用的文本生成模型作为...

【技术保护点】

【技术特征摘要】
1.一种知识图谱自动补全和更新的方法，其特征在于：步骤1：构建知识图谱；获取医药相关领域的历史数据通过爬虫，进行数据清洗、信息抽取、信息整合及构建图数据库，通过以上步骤构建知识图谱；步骤2：根据获取到的数据信息，通过数据预处理建立字典和索引，选择不同的模型对数据进行训练，得到达到预定指标的模型，同时确定评价指标，评估不同模型下的预测结果；步骤3：根据步骤1构建知识图谱，自动选取残缺的三元组相关联的实体和关系，经过数据处理得到模型的原始输入，放入步骤2训练完成的神经网络模型中，得到输出结果；步骤4：将步骤3中的输出结果通过信息抽取、信息整合的步骤导入图数据库中，达到自动补全和更新知识图谱的效果。2.根据权利要求1中所述的一种知识图谱自动补全和更新的方法，其特征在于：步骤1具体包括以下步骤：步骤1.1：通过网络爬虫、公开数据集及专家建的方式获取医药领域的原始数据；步骤1.2：对原始数据进行数据清洗，删除无效数据；步骤1.3：利用信息抽取技术从清洗完成的数据中抽取构建知识图谱所需的实体信息、关系信息、属性信息、属性值信息以及实体之间的相互关系；步骤1.4：通过信息整合方法，对步骤1.3中抽取得到的各种信息进行整合；步骤1.5：构建数据库，将信息整合完成的三元组存放到图数据库中，完成知识图谱的构建；如果构建完成的知识图谱中出现三元组信息缺失，对三元组信息进行补全和更新。3.根据权利要求1中所述的一种知识图谱自动补全和更新的方法，其特征在于：步骤2具体包括以下步骤：步骤2.1：对获取的原始数据进行数...

【专利技术属性】
技术研发人员：申林山，安家庆，李思照，刘开南，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人