一种基于复杂网络的黑名单挖掘方法技术

技术编号:31232657 阅读:13 留言:0更新日期:2021-12-08 10:09
本发明专利技术公开了一种基于复杂网络的黑名单挖掘方法。本发明专利技术步骤如下:1、根据借贷和消费场景下的有效信息维度构建原始网络;2、根据原始网络的邻接矩阵,求得原始网络的转移概率矩阵;3、初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;4、根据迭代公式R

【技术实现步骤摘要】
一种基于复杂网络的黑名单挖掘方法


[0001]本专利技术涉及复杂网络黑名单挖掘
,具体涉及一种基于复杂网络的黑名单挖掘方法,应用于借贷和消费贷场景下的复杂网络。

技术介绍

[0002]随着社会经济的快速发展和时代的进步,人们的生活水平也在不断的提高,对借贷和消费贷等超前消费观念有了更多的需求。在资金方,风险控制直接影响盈利能力,是最为重要的技术之一,因此随之而来的风险控制的需求也越来越多。黑名单是最为常用的风控技术,因此,黑名单发掘成为广大资金方追捧的技术之一。
[0003]现有的黑名单主要来源于政府机构的失信人,或者机构内部积累的失信人信息,然而,在很多案例中,“白名单”用户仍然存在很大的概率成为失信人,并且,内部积累失信人的过程本身对机构造成了严重的经济损失。因此,仅仅依赖于已知失信人信息无法涵盖所有的黑名单用户。传统的机器学习模型广泛应用于违约预测任务,这个过程采用了用户年龄、性别、学历、工作状况等维度的信息,通过机器学习模型对未知个体逾期可能性进行预测,但是这类方法仅仅考虑单一个体的信息,而忽略了个体之间的关联关系。因此,效果往往不够理想。
[0004]PageRank算法是由拉里
·
佩奇(Larry Page)和谢尔盖
·
布林 (Sergey Brin)提出的网页排序算法。算法核心在于给网页一个全局分值,利用分值排序网页的重要性,为搜索用户甄选出优质相关的网页,以提高使用搜索引擎寻找网页的体验舒适度。PageRank算法基于随机游走模型,它以其优良的数学理论基础和计算速度,成为计算机网络研究人员一直追捧至今的优秀算法之一。
[0005]PageRank算法及其扩展算法被广泛的应用于各种网络模型中,例如社交网络、疾病传播网络、论文引用网络、信任网络、影响力分析、推荐系统、偏好与声望排名、信息传播检测等。

技术实现思路

[0006]本专利技术的目的是针对现有技术的不足,提供一种基于复杂网络的黑名单挖掘方法。本专利技术应用于借贷和消费贷场景下的复杂网络。基于已知黑名单用户(种子),在网络中进行风险传播,从而对潜在的黑名单用户进行挖掘。
[0007]为解决上述技术问题,本专利技术采用以下技术方案予以实现:
[0008]一种基于复杂网络的黑名单挖掘方法,包括如下步骤:
[0009]步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络 G;
[0010]步骤S2:根据原始网络G的邻接矩阵D,求得原始网络G的转移概率矩阵P;
[0011]步骤S3:初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;其中,S是种子节点集合;
[0012]步骤S4:根据迭代公式R
n
=DR
n
‑1,求得第n次迭代的排序值;其中R
n
是第n次迭代的
排序值,R
n
‑1是第n

1次迭代的排序值,D是邻接矩阵;
[0013]步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,输出的非种子节点是最有可能的潜在黑名单节点。
[0014]进一步的,步骤S1所述的有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡,将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重;如果节点i和j之间存在边,则D
ij
=w,否则D
ij
=0;D
ij
是原始网络G的邻接矩阵D中的元素。
[0015]进一步的,步骤S2所述的转移概率矩阵P,计算公式如下:
[0016][0017]其中,P
ij
表示转移概率矩阵P的元素。
[0018]与现有技术相比,本申请提供的技术方案,具有的技术效果或优点是:本专利技术通过数据关联关系网络,将已知的风险通过 PageRank算法传播到整个网络节点,量化每个节点的风险程度。具有记录内容详细,运算简便等优点,在风险控制、反洗钱等方面有着广泛的应用前景。
具体实施方式
[0019]下面结合实施例对本专利技术作进一步说明。
[0020]一种基于复杂网络的黑名单挖掘方法,包括步骤如下:
[0021]步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络 G,其中有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡等,并将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重w;如果节点i和j之间存在边,则D
ij
=w,否则D
ij
=0;D
ij
是原始网络G的邻接矩阵D中的元素。
[0022]步骤S2:根据邻接矩阵D,求得原始网络G的转移概率矩阵P,计算公式如下:
[0023][0024]其中,P
ij
表示转移概率矩阵P的元素;
[0025]步骤S3:初始向量R,如果i对应的是种子节点,所述向量R的第i行的值是1/|S|,否则0。这里,S是种子节点集合;
[0026]步骤S4:根据迭代公式R
n
=DR
n
‑1,求得第n次迭代的排序值;其中R
n
是第n次迭代的排序值,R
n
‑1是第n

1次迭代的排序值,D是邻接矩阵。
[0027]步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,这些节点是最有可能的潜在黑名单节点。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于复杂网络的黑名单挖掘方法,其特征在于包括如下步骤:步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络G;步骤S2:根据原始网络G的邻接矩阵D,求得原始网络G的转移概率矩阵P;步骤S3:初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;其中,S是种子节点集合;步骤S4:根据迭代公式R
n
=DR
n
‑1,求得第n次迭代的排序值;其中R
n
是第n次迭代的排序值,R
n
‑1是第n

1次迭代的排序值,D是邻接矩阵;步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,...

【专利技术属性】
技术研发人员:韦虎周朝阁
申请(专利权)人:杭州盈火网络科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1