一种知识图谱优化方法及系统技术方案

技术编号:46601077 阅读:2 留言:0更新日期:2025-10-10 21:32
本发明专利技术涉及知识图谱技术领域,具体为一种知识图谱优化方法及系统,均能够:提取目标知识图谱中各实体;对提取的各实体两两组合得到若干个第一实体对;过滤掉不满足过滤条件的第一实体对,得到过滤后的第一实体对;计算每一个过滤后的第一实体对内两实体的编辑距离;选取编辑距离满足预设阈值条件的过滤后的第一实体对,作为第二实体对;计算第二实体对中两实体之间的相似度,选取目标实体对;计算各目标实体对中各实体的BM25分值;对每一个目标实体对,基于计算的实体对中各实体的BM25分值,实现目标知识图谱中该实体对中实体的统一。本发明专利技术主要用于降低图谱的稀疏性和冗余度。

【技术实现步骤摘要】

本专利技术涉及知识图谱,具体为一种知识图谱优化方法及系统


技术介绍

1、知识图谱是一种以结构化形式表示知识的技术框架,其通过实体(entities)、关系(relations)和属性(attributes)的语义网络模型,将现实世界中的复杂知识以图的结构进行存储与推理。

2、知识图谱构建的流程离不开数据获取和知识抽取,这使得图谱中往往存在较多含义一致但表述不同的实体,致使图谱存在稀疏性和冗余度。

3、此外,在某些具体应用领域,比如创新创业领域,在实现资源智能匹配功能时,需要按关系强度匹配最可能成交的资源,但目前的图谱中缺乏量化关系强度。


技术实现思路

1、针对以上不足,本专利技术提供一种知识图谱优化方法及系统,以解决上述至少一方面的问题。

2、第一方面,本专利技术提供一种知识图谱优化方法,方法包括:

3、s1、提取目标知识图谱中各实体;

4、s2、对提取的各实体两两组合,得到若干个第一实体对;

5、s3、对所述若干个第一实体对,过滤掉不本文档来自技高网...

【技术保护点】

1.一种知识图谱优化方法,其特征在于,方法包括:

2.根据权利要求1所述的知识图谱优化方法,其特征在于,

3.根据权利要求2所述的知识图谱优化方法,其特征在于,

4.根据权利要求2所述的知识图谱优化方法,其特征在于,步骤S61中,采用预先训练好的BERT模型生成每一个第二实体对对应的两个文本字符串的词向量。

5.根据权利要求4所述的知识图谱优化方法,其特征在于,预先训练好的BERT模型的获取方法,包括:

6.根据权利要求5所述的方法,其特征在于,利用所述第一训练集,训练加载的微调BERT模型,得到训练好的BERT模型,具体包括:...

【技术特征摘要】

1.一种知识图谱优化方法,其特征在于,方法包括:

2.根据权利要求1所述的知识图谱优化方法,其特征在于,

3.根据权利要求2所述的知识图谱优化方法,其特征在于,

4.根据权利要求2所述的知识图谱优化方法,其特征在于,步骤s61中,采用预先训练好的bert模型生成每一个第二实体对对应的两个文本字符串的词向量。

5.根据权利要求4所述的知识图谱优化方法,其特征在于,预先训练好的bert模型的获取方法,包括:<...

【专利技术属性】
技术研发人员:张宏董晨晨王志玉祝发田家辉杨春蕾
申请(专利权)人:山东浪潮创新创业科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1