知识图谱构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35676482 阅读:14 留言:0更新日期:2022-11-23 14:14
本公开提供了一种知识图谱构建方法、装置、电子设备及存储介质,涉及数据处理领域。该方法包括:对多个数据源中的数据分别进行知识抽取,得到所述多个数据源的数据实体信息;将所述多个数据源的数据实体信息分别进行隐私计算处理,得到所述多个数据源的加密实体信息;根据预设的实体融合规则和所述加密实体信息,对所述多个数据源的数据进行实体知识融合处理,得到实体融合信息;根据所述实体融合信息,构建融合所述多个数据源的知识图谱。本公开能够以在多方明文数据不出本地的情况下构建融合知识图谱,有效利用多方的数据解决信息不对称、计算结果不准确的问题,识别更复杂、更全面的关系链条以及风险。全面的关系链条以及风险。全面的关系链条以及风险。

【技术实现步骤摘要】
知识图谱构建方法、装置、电子设备及存储介质


[0001]本公开涉及数据处理领域,尤其涉及一种知识图谱构建方法、装置、电子设备及存储介质。

技术介绍

[0002]在社会信息化建设的过程中,同一身份实体的数据在不同行业或领域相互独立存储、独立维护,彼此间相互孤立,形成了物理上的数据孤岛。单一来源的数据仅能从某个维度对实体进行分析,使得对预警对象缺乏全面的分析把控。
[0003]相关技术中实现多方数据联合的方式通常包括:
[0004]1.将各参与方数据汇总在一起,然后进行模型训练并共同应用该模型;
[0005]2.将各参与方数据共同存放在第三方;
[0006]3.各参与方通过定制的数据流通平台实现数据共享,各参与方之间互相约定接口,通过接口调用对应的数据。
[0007]然而,以上方式均会存在数据泄漏的风险,极有可能会给各参与方造成重大损失,同时也可能因此降低各参与方之间的信任度。此外,数据流通平台的定制成本高,流程繁琐,平台透明度不够;而传统的数据库通过表格、字段等进行读取,关系层级和表达方式多种多样,难以处理复杂多样的关联分析,在真实场景中难以支撑管理和决策。
[0008]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的相关技术的信息。

技术实现思路

[0009]本公开提供一种文本搜索意图识别方法、装置、电子设备及存储介质,至少在一定程度上克服相关技术中的多方数据联合的数据泄漏使得难以处理复杂多样的数据关联分析的技术问题。
[0010]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0011]根据本公开的一个方面,提供了一种知识图谱构建方法,该方法包括:对多个数据源中的数据分别进行知识抽取,得到所述多个数据源的数据实体信息;将所述多个数据源的数据实体信息分别进行隐私计算处理,得到所述多个数据源的加密实体信息;根据预设的实体融合规则和所述加密实体信息,对所述多个数据源的数据进行实体知识融合处理,得到实体融合信息;根据所述实体融合信息,构建融合所述多个数据源的知识图谱。
[0012]在一些实施例中,所述将所述数据实体信息进行隐私计算处理,得到加密的实体信息之前包括:利用第一预设方式对所述多个数据源的数据实体信息进行算法适配处理,得到所述多个数据源的适配后的数据实体信息;其中,所述第一预设方式包括以下至少之一:区分代码安全区域与非安全区域、计算算子加密和建模梯度参数拟合。
[0013]在一些实施例中,所述将所述数据实体信息进行隐私计算处理,得到加密实体信
息包括:利用第二预设方式对所述多个数据源的适配后的数据实体信息进行隐私计算处理,得到所述多个数据源的加密实体信息;其中,所述第二预设方式包括以下至少之一:可信执行环境、安全多方计算和联邦学习。
[0014]在一些实施例中,所述加密实体信息至少包括:实体身份信息、实体属性信息和实体关系信息。
[0015]在一些实施例中,根据预设的实体融合规则和所述加密实体信息,对所述多个数据源的数据进行实体知识融合处理,得到实体融合信息包括:基于所述多个数据源的所述实体身份信息,计算各实体身份信息的相似度;将所述相似度满足设定阈值的实体身份信息进行知识融合,并将其对应的实体属性信息、实体关系信息进行对齐处理;将处理后的实体身份信息、实体属性信息、实体关系信息作为所述实体融合信息。
[0016]在一些实施例中,根据预设的实体融合规则和所述加密实体信息,对所述多个数据源的数据进行实体知识融合处理,得到实体融合信息之前包括:对所述多个数据源进行信源加密,将数据源和数据源发送的数据明文或代表明文的电信号转化为数据密文;所述多个数据源的加密实体信息在传输加密信道进行知识融合处理。
[0017]在一些实施例中,对多个数据源中的数据分别进行知识抽取,得到所述多个数据源的数据实体信息之后包括:根据所述数据实体信息,对单个数据源中的数据进行知识融合,得到融合后的数据实体信息。
[0018]根据本公开的另一个方面,提供了一种知识图谱构建装置,该装置包括:知识抽取模块,用于:对多个数据源中的数据分别进行知识抽取,得到所述多个数据源的数据实体信息;隐私计算模块,用于:将所述多个数据源的数据实体信息分别进行隐私计算处理,得到所述多个数据源的加密实体信息;知识融合模块,用于:根据预设的实体融合规则和所述加密实体信息,对所述多个数据源的数据进行实体知识融合处理,得到实体融合信息;图谱构建模块,用于:根据所述实体融合信息,构建融合所述多个数据源的知识图谱。
[0019]根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项知识图谱构建方法。
[0020]根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的知识图谱构建方法。
[0021]本公开的实施例所提供的知识图谱构建方法、装置、电子设备及存储介质,通过隐私计算技术可以实现在保护数据本身不对外泄露的前提下进行数据的分析计算,实现不分享数据但分享数据的价值;将多数据源数据进行知识融合后构建知识图谱,可以高效处理多源异构数据,对于关系的挖掘与分析,知识图谱能够找到隐藏关系在行为之下的联系,识别更复杂、更全面的关系链条以及风险,有效利用多方的数据解决信息不对称、计算结果不准确的问题。
[0022]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0023]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施
例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1示出本公开实施例中一种知识图谱构建系统架构示意图;
[0025]图2示出本公开第一实施例中的知识图谱构建方法流程图;
[0026]图3示出本公开第二实施例中的知识图谱构建方法流程图;
[0027]图4示出本公开第三实施例中的知识图谱构建系统框图;
[0028]图5示出本公开第四实施例中的基于多源数据的风险预警方法的流程图;
[0029]图6示出本公开实施例中一种知识图谱构建装置示意图;以及,
[0030]图7示出本公开实施例中一种电子设备的结构框图。
具体实施方式
[0031]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,包括:对多个数据源中的数据分别进行知识抽取,得到所述多个数据源的数据实体信息;将所述多个数据源的数据实体信息分别进行隐私计算处理,得到所述多个数据源的加密实体信息;根据预设的实体融合规则和所述加密实体信息,对所述多个数据源的数据进行实体知识融合处理,得到实体融合信息;根据所述实体融合信息,构建融合所述多个数据源的知识图谱。2.根据权利要求1所述的知识图谱构建方法,其特征在于,所述将所述数据实体信息进行隐私计算处理,得到加密的实体信息之前包括:利用第一预设方式对所述多个数据源的数据实体信息进行算法适配处理,得到所述多个数据源的适配后的数据实体信息;其中,所述第一预设方式包括以下至少之一:区分代码安全区域与非安全区域、计算算子加密和建模梯度参数拟合。3.根据权利要求2所述的知识图谱构建方法,其特征在于,所述将所述数据实体信息进行隐私计算处理,得到加密实体信息包括:利用第二预设方式对所述多个数据源的适配后的数据实体信息进行隐私计算处理,得到所述多个数据源的加密实体信息;其中,所述第二预设方式包括以下至少之一:可信执行环境TEE、安全多方计算MPC和联邦学习FL。4.根据权利要求1所述的知识图谱构建方法,其特征在于,所述加密实体信息至少包括:实体身份信息、实体属性信息和实体关系信息。5.根据权利要求4所述的知识图谱构建方法,其特征在于,根据预设的实体融合规则和所述加密实体信息,对所述多个数据源的数据进行实体知识融合处理,得到实体融合信息包括:基于所述多个数据源的所述实体身份信息,计算各实体身份信息的相似度;将所述相似度满足设定阈值的实体身份信息进行知识融合,并将其对应的实体属性信息...

【专利技术属性】
技术研发人员:闫汇杨明川白亮
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1