挖掘知识图谱中隐含信息的方法、系统及电子设备技术方案

技术编号:26259390 阅读:18 留言:0更新日期:2020-11-06 17:53
本发明专利技术公开挖掘知识图谱中隐含信息的方法、系统及电子设备,其中,该方法包括:将原始知识图谱以邻接表的方式存储;基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息;将所述隐含信息补充到原始知识图谱中,得到完整的知识图谱。本发明专利技术提供的挖掘知识图谱中隐含信息的系统,采用上述挖掘知识图谱中隐含信息的方法,减少了信息挖掘过程中的人工工作量,提高了挖掘效率,同时提升了挖掘系统的易维护性。

【技术实现步骤摘要】
挖掘知识图谱中隐含信息的方法、系统及电子设备
本专利技术涉及计算机信息处理
,尤其涉及挖掘知识图谱中隐含信息的方法、系统及电子设备。
技术介绍
目前,知识图谱被广泛用于诸多领域的数据建模与服务中,例如应用在金融领域的企业风险预警系统中,通过企业关联图谱来协助业务人员发现企业之间的关联关系,尤其要发现具有传递性的关联关系。比如,企业之间的股权关系具有传递性,通过股权的穿透式计算可以挖掘疑似实际控制人信息,有助于揭示股权转移、高位减持的风险。分支机构信息也具有传递性,通过考察企业多层的分支机构可以揭示实控关系、关联交易等风险。处于供应链中的企业的上下游关系同样具有传递性,通过挖掘与企业关联的上下游机构,也可以揭示关联交易、经营成本增加、销售利润降低等风险,很多潜在的风险信息可以基于这些传递关系进行获取。但是,在实际构建知识图谱的过程中,由于知识图谱的基础数据不完整、数据更新滞后等问题,很多隐含信息无法及时提供业务人员查询使用,需要业务人员人工分析判断,这降低了挖掘知识图谱的工作效率。比如多层股权关系穿透分析中,从工商底库构建而来的知识图谱往往仅包含一层股权关系,业务人员需要对多层的股权进行手动计算,最后将结果进行录入以对原有知识图谱进行补充。在分析母子公司关系中,业务人员往往需要对知识图谱展开多层循环递归关系后才能找到母公司。这种人为挖掘知识图谱中隐含信息的做法造成了挖掘知识图谱的过程工作量大、效率低下、不易维护等缺点。
技术实现思路
本专利技术的目的在于提供挖掘知识图谱中隐含信息的方法、系统及电子设备,解决了人为挖掘知识图谱中隐含信息时存在的工作量大、效率低下,以及不易维护的问题。为了实现上述目的,本专利技术提供如下技术方案:一种挖掘知识图谱中隐含信息的方法,包括:将原始知识图谱以邻接表的方式存储;基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息;将所述隐含信息补充到原始知识图谱中,得到完整的知识图谱。优选地,将原始知识图谱以邻接表的方式存储的方法包括:将原始知识图谱的节点以一维数组存储,并作为邻接表的表头;将任一节点A的第i个邻接节点的地址以及节点A与第i个邻接节点的关系信息一起存储到节点A的第i个邻接单元中,其中0≤i≤N-1,N为节点A的邻接节点个数。较佳地,基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息的方法包括:获取所述原始知识图谱;接收并存储用户配置的归并算子参数;利用最短路径策略手动触发挖掘知识图谱中隐含信息的任务,或者在原始知识图谱的更新率达到用户设置的更新阈值后,自动触发挖掘知识图谱中隐含信息的任务。具体地,所述归并算子参数用四元组表示,其中,r为关系名称,p为关系r的属性,φ为串联归并算子,γ为并联归并算子;针对关系r的属性p的值,在串联方式上采用串联归并算子φ计算,在并联方式上采用并联归并算子γ计算。进一步地,所述最短路径策略采用Floyd-Warshall算法。优选地,在原始知识图谱的更新率达到用户设置的更新阈值后,自动触发挖掘知识图谱中隐含信息的任务的方法包括:监控原始知识图谱的更新率,所述更新率记为ΔNr/Nr,其中Nr为原始知识图谱中关系r的数量,ΔNr是关系r的变动数量;接收并存储用户设置的更新阈值K,K∈[0,1];实时比较所述更新率ΔNr/Nr和所述更新阈值K,当ΔNr/Nr>K时,自动触发挖掘知识图谱中隐含信息的任务。较佳地,将隐含信息补充到原始知识图谱中的方法包括:将隐含信息直接补充到原始知识图谱中,或者将隐含信息返回给用户确认后再补充到原始知识图谱中。较好地,挖掘知识图谱中隐含信息的方法还包括:将隐含信息挖掘任务的执行进程通过可视化监控界面展示给用户,同时存储到挖掘日志中。一种挖掘知识图谱中隐含信息的系统,包括存储模块、挖掘模块及反馈模块,其中,所述存储模块用于将原始知识图谱以邻接表的方式存储;所述挖掘模块基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息;所述反馈模块用于将所述隐含信息补充到原始知识图谱中,得到完整的知识图谱。一种电子设备,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述挖掘知识图谱中隐含信息的方法。与现有技术相比,本专利技术提供的挖掘知识图谱中隐含信息的方法、系统及电子设备具有以下有益效果:本专利技术提供的挖掘知识图谱中隐含信息的方法,将原始知识图谱以邻接表的方式存储,存储结构简单,可以节省存储空间同时提高查询效率;然后基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息,并且将隐含信息补充到原始知识图谱中,得到完整的知识图谱。通过配置好的归并算子参数及最短路径策略获取隐含信息,减少了信息挖掘过程中的人工工作量,提高了挖掘效率,同时提升了挖掘系统的易维护性。本专利技术提供的挖掘知识图谱中隐含信息的系统,采用上述挖掘知识图谱中隐含信息的方法,解决了人为挖掘知识图谱中隐含信息时存在的工作量大、效率低下,以及不易维护的问题。本专利技术提供的电子设备,能够执行上述挖掘知识图谱中隐含信息的方法,减少了信息挖掘过程中的人工工作量,提高了挖掘效率,同时提升了挖掘系统的易维护性。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1为本专利技术实施例中挖掘知识图谱中隐含信息的方法流程示意图;图2为本专利技术实施例中的一种企业股权关系的原始知识图谱示意图;图3为本专利技术实施例中一种以邻接表的方式存储的企业股权关系的原始知识图谱示意图;图4为本专利技术实施例中自动触发挖掘知识图谱中隐含信息任务的方法流程图;图5为本专利技术实施例中多个固定系统组合固定示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本专利技术保护的范围。实施例一请参阅图1,本实施例提供的挖掘知识图谱中隐含信息的方法,包括:将原始知识图谱以邻接表的方式存储;基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息;将隐含信息补充到原始知识图谱中,得到完整的知识图谱。本专利技术实施例提供的挖掘知识图谱中隐含信息的方法,将原始本文档来自技高网...

【技术保护点】
1.一种挖掘知识图谱中隐含信息的方法,其特征在于,包括:/n将原始知识图谱以邻接表的方式存储;/n基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息;/n将所述隐含信息补充到原始知识图谱中,得到完整的知识图谱。/n

【技术特征摘要】
1.一种挖掘知识图谱中隐含信息的方法,其特征在于,包括:
将原始知识图谱以邻接表的方式存储;
基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息;
将所述隐含信息补充到原始知识图谱中,得到完整的知识图谱。


2.根据权利要求1所述的挖掘知识图谱中隐含信息的方法,其特征在于,将原始知识图谱以邻接表的方式存储的方法包括:
将原始知识图谱的节点以一维数组存储,并作为邻接表的表头;
将任一节点A的第i个邻接节点的地址以及节点A与第i个邻接节点的关系信息一起存储到节点A的第i个邻接单元中,其中0≤i≤N-1,N为节点A的邻接节点个数。


3.根据权利要求1所述的挖掘知识图谱中隐含信息的方法,其特征在于,基于用户配置的归并算子参数及原始知识图谱,利用最短路径策略获取隐含信息的方法包括:
获取所述原始知识图谱;
接收并存储用户配置的归并算子参数;
利用最短路径策略手动触发挖掘知识图谱中隐含信息的任务,或者
在原始知识图谱的更新率达到用户设置的更新阈值后,自动触发挖掘知识图谱中隐含信息的任务。


4.根据权利要求1或3所述的挖掘知识图谱中隐含信息的方法,其特征在于,所述归并算子参数用四元组表示,其中,r为关系名称,p为关系r的属性,φ为串联归并算子,γ为并联归并算子;
针对关系r的属性p的值,在串联方式上采用串联归并算子φ计算,在并联方式上采用并联归并算子γ计算。


5.根据权利要求1或3所述的挖掘知识图谱中隐含信息的方法,其特征在于,所述最短路径策略采用Floyd-Warshall算法。


6.根据权利要求3所述的挖掘知识图谱中隐含信...

【专利技术属性】
技术研发人员:沈春泽
申请(专利权)人:苏宁金融科技南京有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1