知识图谱的降噪方法、装置、设备和存储介质制造方法及图纸

技术编号:25835548 阅读:28 留言:0更新日期:2020-10-02 14:16
本发明专利技术实施例公开了一种知识图谱的降噪方法、装置、设备和存储介质。该方法包括:获取预先构建的预设场景下的待降噪的知识图谱,所述知识图谱的三元组包括第一实体、属性值及第二实体,所述属性值为所述第一实体和所述第二实体之间的共有属性值;确定所述知识图谱中每个所述属性值的置信度,所述置信度为所述属性值对与所述属性值对应的实体对的相似度的贡献程度,所述实体对包含所述第一实体与所述第二实体;依据各所述置信度和预设置信度阈值,对所述知识图谱进行基于属性值的三元组降噪处理。通过上述技术方案,实现了知识图谱的降噪处理,提高知识图谱的预测能力和预测结果准确率。

【技术实现步骤摘要】
知识图谱的降噪方法、装置、设备和存储介质
本专利技术实施例涉及知识图谱技术,尤其涉及一种知识图谱的降噪方法、装置、设备和存储介质。
技术介绍
知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。由节点和边构成的三元组是知识图谱的一种通用表示方式。知识图谱已被用来泛指各种大规模的知识库。如果知识图谱中存在实体关系不显著或者实际发生率较低的不重要的三元组(称为知识图谱的噪声),那么知识图谱会给后续的应用模型造成较大干扰,故需要对知识图谱进行降噪处理。目前的知识图谱降噪方法主要有:一种是传统的关联规则算法,其通过设置置信度、支持度和提升度等能够表征实体关系牢靠程度的关联指标的阈值来过滤知识图谱中的噪声。例如,常用的置信度的计算方式为:Confidence(X→Y)=P(Y|X)=P(X,Y)/P(X)=P(X∩Y)/P(X),含义为在发生X的项集中,同时会发生Y的可能性,即X和Y同时发生的个数占仅仅X发生个数的比例。另一种是置信度感知知识表示学习(confidence-本文档来自技高网...

【技术保护点】
1.一种知识图谱的降噪方法,其特征在于,包括:/n获取预先构建的预设场景下的待降噪的知识图谱,所述知识图谱的三元组包括第一实体、属性值及第二实体,所述属性值为所述第一实体和所述第二实体之间的共有属性值;/n确定所述知识图谱中每个所述属性值的置信度,所述置信度为所述属性值对与所述属性值对应的实体对的相似度的贡献程度,所述实体对包含所述第一实体与所述第二实体;/n依据各所述置信度和预设置信度阈值,对所述知识图谱进行基于属性值的三元组降噪处理。/n

【技术特征摘要】
1.一种知识图谱的降噪方法,其特征在于,包括:
获取预先构建的预设场景下的待降噪的知识图谱,所述知识图谱的三元组包括第一实体、属性值及第二实体,所述属性值为所述第一实体和所述第二实体之间的共有属性值;
确定所述知识图谱中每个所述属性值的置信度,所述置信度为所述属性值对与所述属性值对应的实体对的相似度的贡献程度,所述实体对包含所述第一实体与所述第二实体;
依据各所述置信度和预设置信度阈值,对所述知识图谱进行基于属性值的三元组降噪处理。


2.根据权利要求1所述的方法,其特征在于,在所述预设场景为零售场景时,所述第一实体和所述第二实体的实体类型为物品,所述属性值为物品对应属性的属性值;
所述预设场景下的待降噪的知识图谱通过如下方式预先构建:
确定具有物品标识的各物品;
将各所述物品中具有共有属性值的任两个所述物品分别作为所述知识图谱中的所述第一实体和所述第二实体,且将所述共有属性值作为所述第一实体和所述第二实体之间的属性值,构建所述知识图谱中的各三元组;
由各所述三元组构建所述知识图谱。


3.根据权利要求2所述的方法,其特征在于,确定所述知识图谱中每个所述属性值的置信度包括:
依据所述零售场景对应的用户获取物品的物品获取数据集中的用户信息和物品信息,确定所述知识图谱中每个所述属性值的置信度。


4.根据权利要求3所述的方法,其特征在于,依据所述零售场景对应的用户获取物品的物品获取数据集中的用户信息和物品信息,确定所述知识图谱中每个所述属性值的置信度包括:
依据所述物品获取数据集,确定所述知识图谱对应的用户总数量;
依据所述知识图谱中各实体之间的关联关系及所述物品获取数据集,确定每个所述属性值对应的共同用户总数量,所述共同用户总数量是共同获取所述实体对对应物品的用户的数量总和;
依据每个所述属性值对应的所述共同用户总数量及所述用户总数量,确定所述知识图谱中每个所述属性值的置信度。


5.根据权利要求2所述的方法,其特征在于,在依据各所述置信度和预设置信度阈值,对所述知识图谱进行基于属性值的三元组降噪处理之后,还包括:<...

【专利技术属性】
技术研发人员:承玲璐
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1