【技术实现步骤摘要】
基于启发式的外部知识的知识图谱扩充方法及系统
[0001]本专利技术涉及知识图谱扩充领域,具体涉及一种基于启发式的外部知识的知识图谱扩充方法及系统。
技术介绍
[0002]知识图谱将知识(常识与领域知识)以图结构的形式存储下来,通常储存形式为三元组,即(实体
‑
关系
‑
实体)或(实体
‑
属性
‑
值)对。知识图谱的构建通常由非结构化或半结构化的数据抽取整理成知识图谱要素(实体和关系),再通过建立节点和边构建知识图谱。知识图谱推理是指基于现有的知识图谱,挖掘现有知识图谱中缺失的关系。知识图谱扩充是指借用外部知识对于已有的知识图谱扩充新的知识。知识图谱问答是指一个自然语言描述的问句经过语义理解后,在知识图谱中寻找对应的实体或值作为问句答案的一项技术,是知识图谱常用的下游应用。
[0003]知识图谱能够为各个领域的应用做出强有力的数据支撑。所以,对于任意领域,一个知识体系完备、知识丰富的知识图谱可以具有重要的意义。在拥有一个知识图谱的情况下,知识补全技术 ...
【技术保护点】
【技术特征摘要】
1.基于启发式的外部知识的知识图谱扩充方法,其特征在于,包括:通过基础知识图谱,建立基础知识图谱的索引信息;通过对基础知识图谱和基础知识图谱的索引信息,利用知识启发器,挖掘基础知识图谱的潜在扩充点;通过外部知识,对基础知识的潜在扩充点进行扩充,得到候选扩充知识;通过知识判别器,判别候选扩充知识的合理性;通过加入候选扩充知识,完成知识图谱扩充。2.根据权利要求1所述的基于启发式的外部知识的知识图谱扩充方法,其特征在于,通过基础知识图谱,建立基础知识图谱的索引信息具体包括:对于基础知识图谱,建立局部索引信息,对于基础知识图谱,建立全局索引信息。3.根据权利要求2所述的基于启发式的外部知识的知识图谱扩充方法,其特征在于,对于基础知识图谱,建立局部索引信息具体包括:对所有实体,建立索引,包括实体类别索引、实体出度索引以及实体入度索引;对所有关系,建立索引,包括关系类别索引以及关系数量索引;对所有知识单元建立索引,包括知识单元限定词的索引以及知识单元限定语的索引。4.根据权利要求2所述的基于启发式的外部知识的知识图谱扩充方法,其特征在于,对于基础知识图谱,建立全局索引信息具体包括:建立基础知识图谱的数量统计索引,基础知识图谱的数量包括总知识单元数、总三元组数、总实体数以及总关系数;建立基础知识图谱的分布索引,包括实体类别分布索引、实体出度分布索引、实体入度分布索引、关系类别分布索引、关系数量分布索引、知识单元限定词分布的索引以及知识单元限定语分布的索引。5.根据权利要求1所述的基于启发式的外部知识的知识图谱扩充方法,其特征在于,通过对基础知识图谱和基础知识图谱的索引信息,利用知识启发器,挖掘基础知识图谱的潜在扩充点具体包括:度量基础知识图谱中关键项之间的相似程度;对于当前关键项,选取相似关键项,通过类比推理,得到当前关键项的候选知识扩充项集;对于所有关键项的候选知识扩充项集,通过知识筛选器,选取候选知识扩充项。6.根据权利要求5所述的基于启发式的外部知识的知识图谱扩充方法,其特征在于,度量基础知识图谱中关键项之间的相似...
【专利技术属性】
技术研发人员:百维布新哈,司成良,王欣,展华益,
申请(专利权)人:四川启睿克科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。