【技术实现步骤摘要】
基于多维度关系型数据的风控方法、图聚类方法及装置
[0001]本文件属于风控领域,尤其涉及一种基于多维度关系型数据的风控方法、图聚类方法及装置。
技术介绍
[0002]目前很多领域常用的风控方法是通过构造关系型网络的视图(View),来挖掘群体性风险。群体中的每个对象作为View中节点,以金融领域为例,节点不仅具有不同的属性特征(如注册地址、法人姓名等),同时之间还存在不同类型的关联关系(如介质关联、资金关联等),因此能够构造的关系型网络的视图也有很多种维度。在进行风险识别的时候,业内望能够综合利用不同维度(不同的关联关系、属性特征)的关系型视图数据,以更全面的角度进行节点聚类,从而更加准确地找出风险对象。
[0003]为此,如何融合不同维度的关系型视图数据,并按照各维度对于风险影响的程度进行聚类,是当前亟需解决的技术问题。
技术实现思路
[0004]本说明书实施例目的是提供一种基于多维度关系型数据的风控方法、图聚类方法及装置,能够融合群体对应不同维度的关系型视图数据,并按照各维度对于风险影响的程度进行统一聚类,从而更加准确找出群体中的风险对象。
[0005]为了实现上述目的,本说明书实施例是这样实现的:
[0006]第一方面,提供了一种基于多维度关系型数据的风控方法,包括:
[0007]获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;
[0008]计算各维度的关系型 ...
【技术保护点】
【技术特征摘要】
1.一种基于多维度关系型数据的风控方法,包括:获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果;基于所述聚类结果呈现的所述待执行对象与已知黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。2.根据权利要求1所述的方法,基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,包括:基于拉格朗日乘子法,构建所述目标函数中各维度的相似度矩阵与所述统一矩阵之间互耦合的各变量的拉格朗日函数,其中,任一目标变量的拉格朗日函数中除所述目标变量外的其余变量为固定值;将各变量对应的拉格朗日函数作为损失函数,对所述目标函数的各变量进行优化。3.根据权利要求1所述的方法,所述统一矩阵为拉普拉斯矩阵,所述目标函数中各维度的相似度矩阵与所述统一矩阵之间互耦合的变量包括:各维度的相似度矩阵、各维度的相似度矩阵对应自加权的权重、所述统一矩阵以及所述统一矩阵的嵌入矩阵。4.根据权利要求1所述的方法,获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点,包括:获取目标对象集对应的至少两种模态的原生关系型数据;对所述至少两种模态的原生关系型数据进行特征向量编码,得到所述目标对象集多维度的关系型视图数据。5.根据权利要求4所述的方法,所述至少两种模态的原生关系型数据包括:拓扑类的原生关系型数据、文本类的原生关系型数据、独热码类的原生关系型数据和数值类的原生关系型数据中的至少一者。6.根据权利要求5所述的方法,对所述拓扑类的原生关系型数据进行特征向量编码的方式包括node2vec编码方式,对所述文本类的原生关系型数据进行特征向量编码的方式包括node2vec编码方式,对所述独热码的原生关系型数据进行特征向量编码的方式包括embedding
‑
lookup编码方式,对所述数值类的原生关系型数据进行特征向量编码的方式包括归一化编码方式。7.一种多维度关系型数据的图聚类方法,包括:获取目标对象集的多维度的关系型视图数据,所述目标对象集中的对象作为关系型视
图数据中的节点;计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于预设聚类簇数的秩约束;构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。8.一种基于多维度关系型数据的风控装置,包括:视图数据获取模块,获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;相似度矩阵计算模块,计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;统一矩阵构建模块,构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;目标函数构建模块,构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;目标函数优化模块,基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果;风控执行模块,基于所述聚类结果呈现的所述待执行对象与黑名单对象之间的相似度,对所述待执行对象执...
【专利技术属性】
技术研发人员:王宝坤,王维强,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。