一种构建基于溯源图谱的业务图谱的方法及溯源检索方法技术

技术编号:33997568 阅读:48 留言:0更新日期:2022-07-02 11:16
本发明专利技术涉及知识图谱技术领域,尤其涉及一种构建基于溯源图谱的业务图谱的方法及溯源检索方法,该构建基于溯源图谱的业务图谱的方法,包括:获取用于构建业务图谱的数据源,并为每个数据源标注不同的标识信息,以构建溯源图谱;在构建业务图谱的过程中,基于所述数据源构建业务对象时,从所述溯源图谱中,获取与所述业务对象对应的目标数据源,并获取与所述目标数据源对应的目标标识信息;将所述目标标识信息作为所述业务对象的溯源点ID进行标注,以形成所述业务图谱,以便于能够通过业务图谱中的各个业务对象找到应的数据源,提高了溯源的效率和精度,而且,便于对数据根据抽取源进行质量评估时,对已存入图谱中的数据进行源头质量度评估。量度评估。量度评估。

【技术实现步骤摘要】
一种构建基于溯源图谱的业务图谱的方法及溯源检索方法


[0001]本专利技术涉及知识图谱
,尤其涉及一种构建基于溯源图谱的业务图谱的方法及溯源检索方法。

技术介绍

[0002]知识图谱又称科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术表述知识资源及其载体,挖掘。分析、构建、绘制和显示知识及他们之间的相互联系。
[0003]知识图谱的创建和制作,需要抽取各种信息,并利用数据集成技术将信息孤岛集成在一起,这就构成了具有一定知识意义的知识图谱。
[0004]随着知识图谱技术的发展,我们有更多的手段来建立不同知识之前的链接,比如,可以从多个服务器系统中获取多个文档,再从多个文档中提取有效的实体和关系信息。
[0005]但是,在知识图谱中进行知识抽取结果的存储中,只存抽取后的结果数据,对于该结果数据的来源并没有存储,在对数据根据抽取源进行质量评估时,对已存入图谱中的数据很难进行源头质量度评估。

技术实现思路

[0006]鉴于上述问题本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种构建基于溯源图谱的业务图谱的方法,其特征在于,包括:获取用于构建业务图谱的数据源,并为每个数据源标注不同的标识信息,以构建溯源图谱;在构建业务图谱的过程中,基于所述数据源构建业务对象时,从所述溯源图谱中,获取与所述业务对象对应的目标数据源,并获取与所述目标数据源对应的目标标识信息;将所述目标标识信息作为所述业务对象的溯源点ID进行标注,以形成所述业务图谱。2.如权利要求1所述的方法,其特征在于,所述业务对象的溯源点ID包括:一个溯源点ID,或者一个以上的溯源点ID组成的溯源点集合;所述业务对象包括:业务本体和业务实体,所述业务本体和所述业务实体均为所述业务图谱中的节点,且所述业务实体为所述业务本体中的具体实例。3.如权利要求1所述的方法,其特征在于,所述获取用于构建业务图谱的数据源,并为每个数据源标注不同的标识信息,以构建溯源图谱,包括:获取用于构建业务图谱的数据源,所述数据源包括数据所来源的系统、文档以及所述文档中的文档元素,所述文档元素包括:标题、段落、图表;分别为所述数据所来源的系统、文档以及所述文档中的文档元素标注不同的标识信息;将所述系统、文档以及所述文档中的文档元素分别作为溯源对象,建立溯源对象之间的关系,形成所述溯源图谱。4.如权利要求1所述的方法,其特征在于,所述标识信息中设置有预留位,用于标注数据源的来源类型。5.如权利要求3所述的方法,其特征在于,所述将所述系统、文档以及所述文档中的文档元素分别作为溯源对象,建立所述溯源对象之间的关系,形成所述溯源图谱,包括:根据所述数据所来源的系统与所述文档之间的第一包含关系,将系统与文档之间连线,形成所述第一包含关系;判断所述文档元素是否为所述文档中的一级内容,所述文档中包括多级内容,从所述一级内容至N级内容存在依次包含关系,每级内容的数量大于或等于一个;若是,根据所述文档元素与所述文档之间的第二包含关系,将文档与文档元素之间连线,形成所述第二包含关系;若否,根据所述文档元素之间的第三包含关系,将相邻级别的文档元素之间连线,形成所述第三包含关系,形成所述溯...

【专利技术属性】
技术研发人员:冉双全翟莹莹郭涛
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1