节点性质判断的方法及装置制造方法及图纸

技术编号:36805132 阅读:10 留言:0更新日期:2023-03-09 00:10
本申请提供一种判断节点性质的方法,包括步骤:获取用户拓扑图,用户拓扑图中的各节点用于表征群组用户中的各用户,用户拓扑图中的各边用于表征各用户之间的关系;在各节点中确定待识别节点,并通过图游走算法获取用户拓扑图中的若干局部子图;针对每个局部子图,通过预先训练的判断模型,判断该局部子图是否为以待识别节点为起点游走出的局部子图;根据针对每个局部子图的判断结果识别待识别节点的性质。相应地,本发明专利技术公开了判断节点性质的装置。本发明专利技术公开了判断节点性质的装置。本发明专利技术公开了判断节点性质的装置。

【技术实现步骤摘要】
节点性质判断的方法及装置


[0001]本申请涉及机器学习与图神经网络
,尤其涉及一种节点性质判断方法及装置。

技术介绍

[0002]团伙挖掘一般是在大网络上,通过一些(可能结合了节点属性的)社区分割算法,挖掘、提纯出关系紧密的局部子图。在实际风控业务里,该局部子图对应了一批处于一个社区中、关系紧密、大概率具有风险的账户。但是这些账户中仍然会存在一些实际上无风险的白账户,若直接将整个团伙内的账户输出为风险账户,将对这些白账户造成不必要的打扰。然而,如何对团伙内部账户风险程度进行判定和细分一直是一个难题。
[0003]在现有技术中,通常的排白方案大致包括基于结构判定、基于属性判定、基于有监督模型等。其中,基于结构判定是根据一些人工抽象的业务规则,去对账户周围的局部连接关系做匹配判定,一方面,这需要大量的业务经验输入,风险发生变化时,业务规则也必须做出相应变化,鲁棒性较低;另一方面,图结构匹配本身也具有较大的计算开销。基于属性判定是针对属性的异常点检测,但是异常点检测的前提假设是大部分是正常点,少部分是异常点,因此在这些业务场景中,检测出来的异常点其实是风险较低的账户。该方案由于没有考虑账户间的连接关系,当某些业务场景的账户特征不完备,或者本身账户特征都很相似时,就难以做出正确的判定。在有监督模型方案中,以树模型和有监督图神经网络节点分类模型为例,其同样没有考虑账户连接关系,虽然有监督图神经网络节点分类考虑到了账户属性和连接关系,但是这二者都需要大量的业务黑标签、白标签输入,在标签缺失的情况下难以工作。此外,一旦风险形式发生变化,业务标签出现波动,模型就需要重新进行训练。
[0004]有鉴于此,如何提供一种对团伙内部账户风险进行排白的解决方案,以克服上述现有方案的缺陷或不足,就成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]针对现有技术的对团伙内部账户风险进行排白的方案所存在的上述缺陷,本申请提供了一种节点性质判断方法及装置。
[0006]依据本申请的一个方面,提供一种节点性质判断方法,包括步骤:
[0007]获取用户拓扑图,所述用户拓扑图中的各节点用于表征群组用户中的各用户,所述用户拓扑图中的各边用于表征所述各用户之间的关系;
[0008]在所述各节点中确定待识别节点,并通过图游走算法获取所述用户拓扑图中的若干局部子图;
[0009]针对每个局部子图,通过预先训练的判断模型,判断该局部子图是否为以所述待识别节点为起点游走出的局部子图;
[0010]根据针对每个局部子图的判断结果识别所述待识别节点的性质。
[0011]进一步地,在一些实施方式中,判断模型的输出结果是预测分值,所述预测分值用
于判断该局部子图是否为以所述待识别节点为起点游走出的局部子图,所述方法包括:
[0012]根据多个预测分值的分布情况判断待识别节点的性质。
[0013]进一步地,在一些实施方式中,根据多个预测分值的分布情况判断待识别节点的性质,包括:
[0014]在所述预测分值的两极离散化程度低于预设程度的情况下,判断所述待识别节点为第一性质。
[0015]进一步地,在一些实施方式中,根据多个预测分值的分布情况判断待识别节点的性质,包括:
[0016]获取n个以所述待识别节点为起点游走出的局部子图的第一预测分值,以及n个不以所述待识别节点为起点游走出的局部子图的第二预测分值;
[0017]计算所述第二预测分值与所述第一预测分值的差值平均值,在该平均值小于预设阈值时,判断待识别节点为第一性质。
[0018]进一步地,在一些实施方式中,通过图游走算法获取所述用户拓扑图中的若干局部子图包括:
[0019]以图中任意节点为起点,通过随机游走算法获取所述用户拓扑图中的若干局部子图。
[0020]进一步地,在一些实施方式中,所述判断模型基于下述步骤获得:
[0021]获取样本图,其中,样本图中节点用于表征样本用户,各个节点的集合为样本团伙,节点和节点之间的边用于表征样本用户之间的关系;
[0022]确定样本团伙中的第一节点,并获取样本图的样本子图,其中以第一节点为起点的样本子图存为正样本对训练集,不以第一节点为起点的样本子图存为负样本对训练集;
[0023]确定第一节点的节点表征,以及所述正样本对训练集和负样本对训练集中各个样本子图的子图表征;
[0024]根据节点表征和子图表征建立训练模型,根据正样本对训练集和负样本对训练集对所述训练模型进行训练,得到训练好的判断模型。
[0025]进一步地,在一些实施方式中,确定第一节点的节点表征,包括:
[0026]通过图同构神经网络,将第一节点本身信息和第一节点的邻居节点信息聚合,得到节点表征。
[0027]进一步地,在一些实施方式中,确定各个样本子图的子图表征,包括:
[0028]获取样本子图中所包括的各个节点的节点表征;
[0029]基于各个节点的节点表征,通过图读出函数确定子图表征。
[0030]进一步地,在一些实施方式中,根据节点表征和子图表征建立训练模型,包括:
[0031]根据所述节点表征和所述子图表征建立双线性评分函数,作为训练模型。
[0032]进一步地,在一些实施方式中,获取样本图的样本子图包括:
[0033]通过随机游走算法采集第一节点所对应的正样本对训练集和负样本对训练集。
[0034]进一步地,在一些实施方式中,获取样本图的样本子图之后,所述方法还包括:
[0035]对所述样本子图进行匿名化处理,并存入相应的正样本对训练集或者负样本对训练集。
[0036]依据本申请的另一个方面,提供一种节点性质判断装置,其包括模型模块,以及与
模型模块数据通信的采样模块和判断模块:
[0037]所述采样模块获取用户拓扑图,所述用户拓扑图中的各节点用于表征群组用户中的各用户,所述用户拓扑图中的各边用于表征所述各用户之间的关系;
[0038]所述采样模块在所述各节点中确定待识别节点,并通过图游走算法获取所述用户拓扑图中的若干局部子图;
[0039]所述模型模块针对每个局部子图,通过预先训练的判断模型,判断该局部子图是否为以所述待识别节点为起点游走出的局部子图;
[0040]所述判断模块根据针对每个局部子图的判断结果识别所述待识别节点的性质。
[0041]进一步地,在一些实施方式中,所述模型模块中判断模型的输出结果预测分值,所述预测分值用于判断该局部子图是否为以所述待识别节点为起点游走出的局部子图,
[0042]所述判断模块还用于根据多个预测分值的分布情况判断待识别节点的性质。
[0043]进一步地,在一些实施方式中,所述判断模块还用于在所述预测分值的两极离散化程度低于预设程度的情况下,判断所述待识别节点为第一性质。
[0044]进一步地,在一些实施方式中,所述判断模块还用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种节点性质判断方法,包括步骤:获取用户拓扑图,所述用户拓扑图中的各节点用于表征群组用户中的各用户,所述用户拓扑图中的各边用于表征所述各用户之间的关系;在所述各节点中确定待识别节点,并通过图游走算法获取所述用户拓扑图中的若干局部子图;针对每个局部子图,通过预先训练的判断模型,判断该局部子图是否为以所述待识别节点为起点游走出的局部子图;根据针对每个局部子图的判断结果识别所述待识别节点的性质。2.如权利要求1所述的节点性质判断方法,判断模型的输出结果是预测分值,所述预测分值用于判断该局部子图是否为以所述待识别节点为起点游走出的局部子图,所述方法包括:根据多个预测分值的分布情况判断待识别节点的性质。3.如权利要求2所述的节点性质判断方法,根据多个预测分值的分布情况判断待识别节点的性质,包括:在所述预测分值的两极离散化程度低于预设程度的情况下,判断所述待识别节点为第一性质。4.如权利要求2所述的节点性质判断方法,根据多个预测分值的分布情况判断待识别节点的性质,包括:获取n个以所述待识别节点为起点游走出的局部子图的第一预测分值,以及n个不以所述待识别节点为起点游走出的局部子图的第二预测分值;计算所述第二预测分值与所述第一预测分值的差值平均值,在该平均值小于预设阈值时,判断待识别节点为第一性质。5.如权利要求1所述的节点性质判断方法,所述通过图游走算法获取所述用户拓扑图中的若干局部子图包括:以图中任意节点为起点,通过随机游走算法获取所述用户拓扑图中的若干局部子图。6.如权利要求1所述的节点性质判断方法,所述判断模型基于下述步骤获得:获取样本图,其中,样本图中节点用于表征样本用户,各个节点的集合为样本团伙,节点和节点之间的边用于表征样本用户之间的关系;确定样本团伙中的第一节点,并获取样本图的样本子图,其中以第一节点为起点的样本子图存为正样本对训练集,不以第一节点为起点的样本子图存为负样本对训练集;确定第一节点的节点表征,以及所述正样本对训练集和负样本对训练集中各个样本子图的子图表征;根据节点表征和子图表征建立训练模型,根据正样本对训练集和负样本对训练集对所述训练模型进行训练,得到训练好的判断模型。7.如权利要求6所述的节点性质判断方法,确定第一节点的节点表征,包括:通过图同构神经网络,将第一节点本身信息和第一节点的邻居节点信息聚合,得到节点表征。8.如权利要求6所述的节点性质判断方法,确定各个样本子图的子图表征,包括:获取样本子图中所包括的各个节点的节点表征;
基于各个节点的节点表征,通过图读出函数确定子图表征。9.如权利要求6所述的节点性质判断方法,根据节点表征和子图表征建立训练模型,包括:根据所述节点表征和所述子图表征建立双线性评分函数,作为训练模型。10.如权利要求6所述的节点性质判断方法,获取样本图的样本子图包括:通过随机游走算法采集第一节点所对应的正样本对训练集和负样本对训练集。11.如权利要...

【专利技术属性】
技术研发人员:胡逸飞王宝坤傅幸
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1