【技术实现步骤摘要】
知识图谱校验方法、装置、设备、可读介质和程序产品
[0001]本申请涉及知识图谱
,尤其涉及一种知识图谱校验方法、装置、设备、可读介质和程序产品。
技术介绍
[0002]随着移动互联网的发展,知识图谱在各个领域中的应用越来越广泛。例如,应用于工业领域的知识图谱,由于自动化抽取信息过程中的信息质量控制问题,往往会引入大量的错误知识。而知识图谱校验即利用自动化方法从海量的知识图谱中发现这些错误知识的过程,从而提高知识图谱搜索答案的准确性。
[0003]现有技术中,知识图谱校验技术通常可以分为两类,一种是基于知识图谱内部数据的检测,内部检测方法一般是对知识图谱建模或是通过某种算法检测,从自身统计特征发现可能存在错误的知识,而规则学习算法虽属于内部方法,但大多用于知识图谱补全,而非校验。
[0004]但是现有的规则学习算法不适用于知识图谱校验,其校验准确率不高;而外部检测方法虽识别检错准确,但往往需要逐条验证,消耗的人力成本大。
技术实现思路
[0005]本申请提供一种知识图谱校验方法、装置、设 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱的校验方法,其特征在于,包括:获取待校验的知识图谱数据;通过规则学习算法,对所述待检验的知识图谱数据进行规则提取,获取所述知识图谱数据中规则集合,所述规则集合中包括多个表示所述知识图谱数据中实体之间的描述关系;若所述规则学习算法得到的所述规则集合中的实体及其描述关系满足阈值,则在所述规则集合中确定出错误规则;在所述知识图谱数据中确定所述错误规则对应的实体数据,并对所述错误规则对应的实体数据进行修正。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过规则学习算法,对所述待检验的知识图谱数据进行规则提取,得到所述描述关系的置信度。3.根据权利要求2所述的方法,其特征在于,所述在所述规则集合中确定出错误规则,包括:获取所述描述关系对应的常识知识数据,并根据所述常识知识数据得到描述关系的常识度;根据所述置信度和所述常识度,确定所述错误规则。4.根据权利要求3所述的方法,其特征在于,所述根据所述置信度和所述常识度,确定所述错误规则,包括:若所述置信度分数与所述常识性分数差值的绝对值小于门限值,则判定该规则为错误规则。5.根据权利要求1所述的方法,其特征在于,所述在所述知识图谱数据中确定所述错误规则对应的实体数据,包括:通过动态采样的方法,将所述错误规则在所述待检验知识图谱中进行遍历,查找出实体数据,并从所述实体数据中查找出所有的三元组子集;所述三元组可以包含实体、实体与实体之间的描述关系。6.一种知识图谱的校验装置,包括:...
【专利技术属性】
技术研发人员:李罗政,张丹,赵东岩,
申请(专利权)人:北大方正集团有限公司北京大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。