System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 知识图谱校正方法、系统、设备及存储介质技术方案_技高网

知识图谱校正方法、系统、设备及存储介质技术方案

技术编号:40641302 阅读:5 留言:0更新日期:2024-03-13 21:22
本发明专利技术公开了一种知识图谱校正方法、系统、设备及存储介质,通过深度学习技术从海量的动态数据中提取出有用的知识,而利用因果推理的方法,可以挖掘出数据中的相关性和因果关系,这些关系能够被用于纠正和提升现有知识图谱的质量和准确性,本发明专利技术的方法通过筛选掉与目标知识无关的信息,减小了知识图谱构建和更新过程中的复杂性,并且能有效地过滤数据噪声。此外,本发明专利技术的方法还具有处理和更新大量动态数据的能力,从而能够实现知识图谱的实时更新和优化。

【技术实现步骤摘要】

本专利技术涉及属于知识图谱和数据分析,尤其涉及一种知识图谱校正方法、系统、设备及存储介质


技术介绍

1、在当前的人工智能和数据科学领域,知识图谱的质量和准确性对于决策支持、推荐系统和自然语言处理等多个子领域的应用至关重要。然而,随着大数据的快速发展和深度学习技术的广泛应用,知识图谱的构建和维护面临着前所未有的挑战。这些新的挑战包括如何处理海量的动态数据,如何从这些数据中提取有用的知识,并将这些知识整合到现有的知识图谱中。同时,由于数据的复杂性和动态性,如何在保证知识图谱质量的同时,有效地处理和利用数据中的相关性和因果关系,也是当前知识图谱领域亟待解决的问题。

2、对于与本专利技术相关的专利,申请号为cn202310153811.4的中国专利技术专利申请《一种基于知识图谱目标人物身份识别系统》中公开了,知识图谱构建模块的内部设置有图谱构建模块,可以自动化地进行知识的增量更新,提高了更新效率。然而,该方案主要集中在知识图谱的构建和更新上,并未明确提出如何利用数据中的信息来纠正和提升知识图谱的质量。

3、申请号为cn202110247552.2的中国专利技术专利申请《一种基于知识图谱的知识可信度量方法》中公开了多种计算可信度的步骤,包括关系可信度、属性值可信度以及问题求解可信度的计算。这种方案确实可以提高知识图谱中知识的准确度,但其主要关注的是知识的可信度量,并未明确说明如何利用数据中的信息进行知识图谱的纠正。

4、申请号为cn202310327411.0的中国专利技术专利申请《知识图谱的更新方法、装置、设备及存储介质》中公开了,通过证据存储引擎中的初始知识和相关证据,对待更新知识进行质量评估,筛选出高质量的知识更新知识图谱。尽管这种方法可以提高知识图谱整体的质量,但其主要依赖于已有的证据和信息源,并未涉及到从数据的信息提取新的知识。

5、申请号为cn202111117993.7的中国专利技术专利《基于深度学习的政务领域知识图谱自动化构建方法和装置》中提出了知识抽取和知识修正的概念,并针对实体及关系提出了修正方法,使得知识的表达更加完善。不过,该方法的应用领域主要限制在政务领域,并且主要关注的是知识的抽取和修正,并未明确提出如何利用数据间的信息来纠正和提升知识图谱的质量。

6、综上,以上方案均关注了知识图谱的构建、更新和修正等方面,但主要依赖于已有的知识和信息源,或者关注于特定领域的知识图谱构建。这些方案在处理当前问题时,尚未充分利用数据中的相关性和因果关系,这在一定程度上限制了它们在提升知识图谱质量和准确性方面的能力。因此,如何有效地利用数据中的相关性和因果关系,对知识图谱进行纠正和提升,仍是一个待解决的挑战。

7、有鉴于此,特提出本专利技术。


技术实现思路

1、本专利技术的目的是提供一种知识图谱校正方法、系统、设备及存储介质,可以挖掘出数据中的相关性和因果关系,这些关系能够被用于纠正和提升现有知识图谱的质量和准确性,从而提升后续任务的性能。

2、本专利技术的目的是通过以下技术方案实现的:

3、一种知识图谱校正方法,包括:

4、获取待校正的知识图谱,以及包含待校正的知识图谱中各实体描述数据的数据集,通过结构学习算法从数据集中获得表示各实体间因果关系的因果图,以及结合数据集对每两个实体分别进行条件独立性测试,获得每两个实体之间的相关性;

5、对于每两个实体,根据它们在因果图中的路径以及它们之间的相关性,计算出每两个实体的关联强度;

6、基于计算出的每两个实体的关联强度,对待校正的知识图谱进行校正处理。

7、一种知识图谱校正系统,包括:

8、数据获取与信息挖掘单元,用于获取待校正的知识图谱,以及包含待校正的知识图谱中各实体描述数据的数据集,通过结构学习算法从数据集中获得表示各实体间因果关系的因果图,以及结合数据集对每两个实体分别进行条件独立性测试,获得每两个实体之间的相关性;

9、实体关联分析单元,用于对于每两个实体,根据它们在因果图中的路径以及它们之间的相关性,计算出每两个实体的关联强度;

10、校正处理单元,用于基于计算出的每两个实体的关联强度,对待校正的知识图谱进行校正处理。

11、一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

12、其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。

13、一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。

14、由上述本专利技术提供的技术方案可以看出,通过信息挖掘技术从海量的动态数据中提取出有用的信息,而利用因果推理的方法,可以挖掘出数据中的相关性和因果关系,这些关系能够被用于纠正和提升现有知识图谱的质量和准确性,本专利技术的方法通过筛选掉与目标知识无关的信息,减小了知识图谱构建和更新过程中的复杂性,并且能有效地过滤数据噪声。此外,本专利技术的方法还具有处理和更新大量动态数据的能力,从而能够实现知识图谱的实时更新和优化。

本文档来自技高网...

【技术保护点】

1.一种知识图谱校正方法,其特征在于,包括:

2.根据权利要求1所述的一种知识图谱校正方法,其特征在于,所述对待校正的知识图谱中每两个实体分别进行条件独立性测试,获得每两个实体之间的相关性包括:

3.根据权利要求2所述的一种知识图谱校正方法,其特征在于,O(a,b)和H(a,b)表示为:

4.根据权利要求2所述的一种知识图谱校正方法,其特征在于,结合O(A,B)和h(A,B)计算G2测试的显著性水平G2(h,t),表示为:

5.根据权利要求1所述的一种知识图谱校正方法,其特征在于,所述对于每两个实体,根据它们在因果图中的路径以及它们之间的相关性,计算出每两个实体的关联强度包括:

6.根据权利要求1或5所述的一种知识图谱校正方法,其特征在于,每条完整路径中的关联强度计算方式如下:

7.根据权利要求1所述的一种知识图谱校正方法,其特征在于,所述基于计算出的每两个实体的关联强度,对待校正的知识图谱进行校正处理;

8.一种知识图谱校正系统,其特征在于,包括:

9.一种处理设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

10.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~7任一项所述的方法。

...

【技术特征摘要】

1.一种知识图谱校正方法,其特征在于,包括:

2.根据权利要求1所述的一种知识图谱校正方法,其特征在于,所述对待校正的知识图谱中每两个实体分别进行条件独立性测试,获得每两个实体之间的相关性包括:

3.根据权利要求2所述的一种知识图谱校正方法,其特征在于,o(a,b)和h(a,b)表示为:

4.根据权利要求2所述的一种知识图谱校正方法,其特征在于,结合o(a,b)和h(a,b)计算g2测试的显著性水平g2(h,t),表示为:

5.根据权利要求1所述的一种知识图谱校正方法,其特征在于,所述对于每两个实体,根据它们在因果图中的路径以及它们之间...

【专利技术属性】
技术研发人员:王翔宇吕德锐陈律舟班泰瑜陈秋菊陈欢欢
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1