【技术实现步骤摘要】
一种知识图谱的构建方法及装置、电子设备、存储介质
[0001]本申请涉及数据处理
,尤其涉及一种知识图谱的构建方法及装置、电子设备、存储介质。
技术介绍
[0002]在企业数据现代化治理的手段中,数据入湖是现阶段比较主流的数据集中化管控方式,可以针对企业各种各样的原始数据,将数据全部集中起来提供存取、处理、分析及传输。随着对于数据处理的需求提升,企业常采用一个共有数据湖和多个子数据湖的结构以运行整个企业的工作负载,共有数据湖接收私有数据湖传回的数据并做汇聚计算,存在业务处理不及时的问题,并且多个子数据湖较为分散,易形成地理位置和业务呈现孤岛隔离的数据,进而影响企业数据的整体关联性。
技术实现思路
[0003]为解决上述技术问题,本申请的实施例提供了一种知识图谱的构建方法及装置、电子设备、计算机可读存储介质、计算机程序产品。
[0004]根据本申请实施例的一个方面,提供了一种知识图谱的构建方法,包括:从不同实体库获取针对运营商的元数据,以得到全局元数据;基于从所述全局元数据中获取到的指定数量的元数 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱的构建方法,其特征在于,所述方法包括:从不同实体库获取针对运营商的元数据,以得到全局元数据;基于从所述全局元数据中获取到的指定数量的元数据,构建得到初始知识图谱;对所述全局元数据中除所述指定数量的元数据之外的其他元数据进行结构类型的识别处理,确定所述其他元数据的结构类型;基于所述其他元数据的结构类型,确定所述其他元数据的实体关联关系,并基于所述其他元数据的实体关联关系调整所述初始知识图谱,得到目标知识图谱。2.根据权利要求1所述的方法,其特征在于,所述基于所述其他元数据的结构类型,确定所述其他元数据的实体关联关系,包括:若所述其他元数据中存在属于第一结构类型的元数据,则从所述第一结构类型的元数据中提取所述第一结构类型的元数据对应的三元组,并基于提取到的三元组得到所述第一结构类型的元数据对应的实体关联关系;若所述其他元数据中存在属于第二结构类型的元数据,则对所述第二结构类型的元数据进行针对实体、关系和属性的提取处理,并基于提取到的实体、关系和属性构建得到三元组,并基于提取到的三元组得到所述第二结构类型的元数据对应的实体关联关系。3.根据权利要求1所述的方法,其特征在于,所述其他元数据包括多个元数据;所述基于所述其他元数据的结构类型,确定所述其他元数据的实体关联关系,包括:基于所述多个元数据的实体信息对所述多个元数据进行实体对齐处理,得到所述多个元数据之间的实体关联关系;所述基于所述其他元数据的实体关联关系调整所述初始知识图谱,得到目标知识图谱,包括:基于所述多个元数据之间的实体关联关系,对相同实体对应的实体信息进行归纳处理,得到实体调整量;基于所述实体调整量调整所述初始知识图谱,得到所述目标知识图谱。4.根据权利要求1所述的方法,其特征在于,所述基于从所述全局元数据中获取到的指定数量的元数据,构建得到初始知识图谱,包括:对所述指定数量的元数据进行预处理,得到预处理后的元数据;其中,所述预处理包括内容抽取处理、格式转换处理和加载处理中的至少一种;基于所述预处理后的元数据,构建得到所述初始知识图谱。5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述...
【专利技术属性】
技术研发人员:李馨迟,张凯程,刘康,郭枝虾,夏晓晴,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。