基于大规模关系图谱的股权关系穿透方法技术

技术编号:39825927 阅读:5 留言:0更新日期:2023-12-29 16:01
本发明专利技术实施例公开了一种基于大规模关系图谱的股权关系穿透方法

【技术实现步骤摘要】
基于大规模关系图谱的股权关系穿透方法、装置及设备


[0001]本专利技术涉及知识图谱
和数据处理,尤其涉及一种基于大规模关系图谱的股权关系穿透方法

装置及计算机设备


技术介绍

[0002]近年来,随着资本市场的进一步发展,股权投资关系成为不同企业

个人

金融产品之间至关重要的联系,也成为信用风险传递和转化的重要链条

因此金融机构需要更加清晰和完整的梳理和定位不同主体之间的多层股权关系,从而作为风险管理和风险投资的重要判断和决策依据

[0003]但是,在现有技术中针对股权关系探查技术存在计算效率慢

穿透层级少

路径穷举难的问题

具体的,由于股权关系层层嵌套,呈网状分布,往往从一个主体出发,探寻3‑5层以内的关系,效率还能够忍受,但是大于5层之后,效率呈指数级下降,往往无法在用户可接受的时间内获得结果,甚至会由于算力不够而宕机,也就是说,存在计算效率慢的问题

进一步的,传统股权穿透方法往往只能支持
10
层以内的股权关系穿透和遍历,
10
层以外的股权穿透会由于图数据库

硬件资源

超级节点等问题导致内存溢出

系统假死等情况,而对于一个大中型的上市发债企业或集团,往往其股权关系深度在
10
层以上,最多甚至可达
100
层以上

通过企业股权关系穿透,主体数量会根据股权层级数呈指数级增长

用户在定位或搜素目标企业时,往往陷入大海捞针

因此需要通过相关关键指标来对结果范围进行缩小和筛选

而相关筛选指标的计算会极大增加算法算力要求,尤其例如累计持股比例等需要根据层级迭代计算的指标,会进一步加大计算负载

当探寻层级较深后,从起始节点到目标节点的路径通常不止一条,往往随着层级深度而呈指数级增长,穷举并返回所有路径的时间复杂度和空间复杂度也大幅上升;如果要返回从起始节点出发到所有节点的路径,就更容易造成内存不足或假死宕机的现象

[0004]也就是说,现有技术中无法支持股权穿透层级较多活股权穿透结果较复杂的情况,在大规模股权关系图谱的股权关系穿透中,存在明显的效率低下以及结果准确度不足的问题,从而导致基于股权穿透结果的后续的关联风险识别等操作的准确率也存在明显不足


技术实现思路

[0005]基于此,有必要针对上述问题,提出了一种基于大规模关系图谱的股权关系穿透方法

装置及计算机设备

[0006]在本专利技术的第一部分,提供了一种基于大规模关系图谱的股权关系穿透方法,所述方法包括:
[0007]获取待穿透的股权关系数据,按照预设的遍历参数对所述股权关系数据进行遍历,对遍历到的节点以及节点之间的关系按照预设的数据结构进行加载,以获取与所述股权关系数据对应的第一股权关系图,所述预设的遍历参数包括遍历层级数

遍历节点个数
中的一个或多个;
[0008]采用强连通检测算法,对所述第一股权关系图进行子图切割操作,以得到至少一个子图,对得到的每一个子图进行环检测,并对检测到的环进行剔除处理,以得到与所述第一股权关系图对应的第二股权关系图;
[0009]根据第二股权关系图生成与所述第二股权关系图对应的第一邻接矩阵,对所述第一邻接矩阵进行稀疏化处理得到第二稀疏矩阵,基于累计持股比例和第二稀疏矩阵计算第三特征值矩阵,其中,所述第三特征值矩阵表示节点的累计持股比例;其中,所述第一邻接矩阵的数值为所述第二股权关系图中边的权重值;
[0010]确定待探查目标,根据所述待探查目标从所述第三特征值矩阵获取目标节点集合;
[0011]对所述第三特征值矩阵进行拓扑排序以生成拓扑排序节点序列,并基于拓扑排序节点序列对其中包含的每一个节点进行遍历,生成与每一个节点对应的前序路径;根据所述得到的前序路径,获取目标节点集合中的每一个目标节点的股权穿透路径作为与所述待探查目标对应的目标股权关系

[0012]可选的,所述按照预设的遍历参数对所述股权关系数据进行遍历的步骤,还包括:确定至少一个起始节点
;
对于任一起始节点,基于该起始节点对所述股权关系数据中包含的节点以及节点之间的关系进行遍历,其中,对该起始节点的遍历不超过所述遍历层级数和
/
或遍历节点个数;获取当前次遍历对应的最后一层节点在所述股权关系数据中的出度;在所述出度大于0的情况下,将当前遍历对应的最后一层节点添加到所述至少一个起始节点中

[0013]可选的,所述确定至少一个起始节点的步骤之后,还包括:针对每一个起始节点,确定该起始节点满足预设的剪枝参数,其中,所述预设的剪枝参数包括最大穿透层数和单层持股比例阈值中的一个或多个;在所述起始节点满足所述预设的剪枝参数的情况下,执行所述对于任一起始节点,基于该起始节点对所述股权关系数据中包含的节点以及节点之间的关系进行遍历的步骤
;
在所述起始节点不满足所述预设的剪枝参数的情况下,删除该起始节点

[0014]可选的,所述对遍历到的节点以及节点之间的关系按照预设的数据结构进行加载,以获取与所述股权关系数据对应的股权关系图的步骤,还包括
:
对所述遍历到的节点以及节点之间的关系进行反序列化处理
,
并按照预设的数据结构对所述反序列化处理的节点以及节点之间的关系进行存储,其中,预设的数据结构包括十字链表或邻接多重表

[0015]可选的,所述采用强连通检测算法,对所述第一股权关系图进行子图切割操作,以得到至少一个子图的步骤之前,还包括:对所述第一股权关系图进行标准化处理,其中,所述标准化处理包括对所述股权关系图包括的节点



边权值进行标准化处理,其中,标准化处理包括剔除处理或赋0处理;对所述股权关系图进行自循环检测,删除所述股权关系图中的自循环的边

[0016]可选的,所述基于累计持股比例和第二稀疏矩阵计算第三特征值矩阵,其中,所述第三特征值矩阵表示节点的累计持股比例的步骤,还包括:根据所述第二稀疏矩阵确定节点之间的累计持股比例,以计算一阶邻接矩阵,并根据累计持股比例和上一阶邻接矩阵,计算下一阶邻接矩阵,直至得到
n
阶邻接矩阵,其中,
n
为股权累计的最大层级,
;根据
n
阶邻接矩阵计算
n
阶累计持股比例矩阵,其中,则,其中;其中,
n
阶累计持股比例矩阵为所述第三特征值矩阵

[0017]可选的,所述确定待探查目标,根据所述待本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于大规模关系图谱的股权关系穿透方法,其特征在于,所述方法包括:获取待穿透的股权关系数据,按照预设的遍历参数对所述股权关系数据进行遍历,对遍历到的节点以及节点之间的关系按照预设的数据结构进行加载,以获取与所述股权关系数据对应的第一股权关系图,所述预设的遍历参数包括遍历层级数

遍历节点个数中的一个或多个;采用强连通检测算法,对所述第一股权关系图进行子图切割操作,以得到至少一个子图,对得到的每一个子图进行环检测,并对检测到的环进行剔除处理,以得到与所述第一股权关系图对应的第二股权关系图;根据第二股权关系图生成与所述第二股权关系图对应的第一邻接矩阵,对所述第一邻接矩阵进行稀疏化处理得到第二稀疏矩阵,基于累计持股比例和第二稀疏矩阵计算第三特征值矩阵,其中,所述第三特征值矩阵表示节点的累计持股比例;其中,所述第一邻接矩阵的数值为所述第二股权关系图中边的权重值;确定待探查目标,根据所述待探查目标从所述第三特征值矩阵获取目标节点集合;对所述第三特征值矩阵进行拓扑排序以生成拓扑排序节点序列,并基于拓扑排序节点序列对其中包含的每一个节点进行遍历,生成与每一个节点对应的前序路径;根据所述得到的前序路径,获取目标节点集合中的每一个目标节点的股权穿透路径作为与所述待探查目标对应的目标股权关系
。2.
根据权利要求1所述的基于大规模关系图谱的股权关系穿透方法,其特征在于,所述按照预设的遍历参数对所述股权关系数据进行遍历的步骤,还包括:确定至少一个起始节点
;
对于任一起始节点,基于该起始节点对所述股权关系数据中包含的节点以及节点之间的关系进行遍历,其中,对该起始节点的遍历不超过所述遍历层级数和
/
或遍历节点个数;获取当前次遍历对应的最后一层节点在所述股权关系数据中的出度;在所述出度大于0的情况下,将当前遍历对应的最后一层节点添加到所述至少一个起始节点中
。3.
根据权利要求2所述的基于大规模关系图谱的股权关系穿透方法,其特征在于,所述确定至少一个起始节点的步骤之后,还包括:针对每一个起始节点,确定该起始节点满足预设的剪枝参数,其中,所述预设的剪枝参数包括最大穿透层数和单层持股比例阈值中的一个或多个;在所述起始节点满足所述预设的剪枝参数的情况下,执行所述对于任一起始节点,基于该起始节点对所述股权关系数据中包含的节点以及节点之间的关系进行遍历的步骤
;
在所述起始节点不满足所述预设的剪枝参数的情况下,删除该起始节点
。4.
根据权利要求1所述的基于大规模关系图谱的股权关系穿透方法,其特征在于,所述对遍历到的节点以及节点之间的关系按照预设的数据结构进行加载,以获取与所述股权关系数据对应的股权关系图的步骤,还包括
:
对所述遍历到的节点以及节点之间的关系进行反序列化处理
,
并按照预设的数据结构对所述反序列化处理的节点以及节点之间的关系进行存储,其中,预设的数据结构包括十字链表或邻接多重表
。5.
根据权利要求1所述的基于大规模关系图谱的股权关系穿透方法,其特征在于,所述
采用强连通检测算法,对所述第一股权关系图进行子图切割操作,以得到至少一个子图的步骤之前,还包括:对所述第一股权关系图进行标准化处理,其中,所述标准化处理包括对所述股权关系图包括的节点



边权值进行标准化处理,其中,标准化处理包括剔除处理或赋0处理;对所述股权关系图进行自循环检测,删除...

【专利技术属性】
技术研发人员:赵方黄佳胡新万迎童灵馨秋永杰郑虎
申请(专利权)人:中证数智科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1