风险用户识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35480007 阅读:24 留言:0更新日期:2022-11-05 16:30
本申请涉及一种风险用户识别方法、装置、计算机设备和存储介质。所述方法包括:获取目标关系图谱,目标关系图谱为包含目标用户的关系图谱;对目标关系图谱中各节点的属性进行聚合,得到第一特征;利用基于图神经网络的深度学习算法对目标关系图谱中的各节点进行特征提取,得到第二特征;调用预先训练的风险识别模型,风险识别模型包括前馈神经网络单元和提升树单元,将第二特征输入前馈神经网络单元以得到中间分值,将中间分值和第一特征输入提升树单元以得到目标用户的风险识别结果。采用本方法能够提高风险用户识别的准确性。方法能够提高风险用户识别的准确性。方法能够提高风险用户识别的准确性。

【技术实现步骤摘要】
风险用户识别方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种风险用户识别方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术的发展,互联网金融蓬勃发展,风险管控也越来越成为核心价值的所在。风险包括信用风险和欺诈风险两部分,前者更多的关注如何审批合理的额度及定价,后者则是侧重精准识别和拦截。
[0003]传统的风险识别模型,例如,反伪冒、反诈骗模型等,非常依赖用户的个人信息,包括性别、年龄、收入、征信报告、操作行为等,可以说模型的识别能力依赖于收集到的用户信息的多少,从而导致前端用户信息采集复杂,在收集到的信息过少或信息真实度较低时,风险模型难以适用,模型的识别准确度低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高风险用户识别准确性的风险用户识别方法、装置、计算机设备和存储介质。
[0005]一种风险用户识别方法,该方法包括:
[0006]获取目标关系图谱,目标关系图谱为包含目标用户的关系图谱;
[0007]对目标关系图谱中各节点的属性进行聚合,得到第一特征;
[0008]利用基于图神经网络的深度学习算法对目标关系图谱中的各节点进行特征提取,得到第二特征;
[0009]调用预先训练的风险识别模型,风险识别模型包括前馈神经网络单元和提升树单元,将第二特征输入前馈神经网络单元以得到中间分值,将中间分值和第一特征输入提升树单元以得到目标用户的风险识别结果。
[0010]在其中一个实施例中,获取目标关系图谱的步骤,包括:
[0011]调取历史用户的历史关联人信息;
[0012]根据历史关联人信息将历史用户与目标用户进行反向关联,根据反向关联的结果构建目标关系图谱。
[0013]在其中一个实施例中,风险识别模型的训练方法,包括:
[0014]获取历史关系图谱,历史关系图谱为由历史用户构成的关系图谱;
[0015]为历史关系图谱中的各节点标注类别标签;其中,类别标签包括风险标签、优质标签和未知标签;
[0016]从历史关系图谱中筛选节点以生成样本关系图谱;
[0017]根据样本关系图谱对风险识别模型进行训练。
[0018]在其中一个实施例中,从历史关系图谱中筛选节点以生成样本关系图谱的步骤,包括:
[0019]将历史关系图谱中的多个节点划分为有特征节点和无特征节点;
[0020]对无特征节点进行欠采样处理;
[0021]根据预设的比例筛选有特征点和无特征节点,根据筛选出的有特征节点和无特征节点生成样本关系图谱。
[0022]在其中一个实施例中,根据样本关系图谱对风险识别模型进行训练的步骤,包括:
[0023]根据预设的关联度从样本关系图谱中提取样本子图;
[0024]对样本子图中各节点的属性进行聚合,得到第一样本特征;
[0025]利用基于图神经网络的深度学习算法对样本子图中的各节点进行特征提取,得到第二样本特征;
[0026]根据第二样本特征对前馈神经网络单元进行训练;
[0027]根据前馈神经网络单元的输出数据和第一样本特征对提升树单元进行训练,得到训练后的风险识别模型。
[0028]在其中一个实施例中,该方法还包括:
[0029]根据关联度、各节点的属性的数量、风险识别结果、各节点的关联节点的个数之中的至少一个对风险识别模型进行优化。
[0030]在其中一个实施例中,关系图谱中的节点以及边关系由图数据库存储,关系图谱中各节点的属性通过键值对的方式缓存至内存。
[0031]一种风险用户识别装置,该装置包括:
[0032]关系谱图获取模块,用于获取目标关系图谱,目标关系图谱是包含目标用户的关系图谱;
[0033]第一特征提取模块,用于对目标关系图谱中各节点的属性进行聚合,得到第一特征;
[0034]第二特征提取模块,用于利用基于图神经网络的深度学习算法对目标关系图谱中的各节点进行特征提取,得到第二特征;
[0035]风险用户识别模块,用于调用预先训练的风险识别模型,风险识别模型包括前馈神经网络单元和提升树单元,将第二特征输入前馈神经网络单元以得到中间分值,将中间分值和第一特征输入提升树单元以得到目标用户的风险识别结果。
[0036]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的任意一项的风险用户识别方法的步骤。
[0037]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的任意一项的风险用户识别方法的步骤。
[0038]上述风险用户识别方法、装置、计算机设备和存储介质,通过确定目标用户并获取目标用户的关系图谱,针对关系图谱分别采用属性聚合以及深度学习算法这两种不同的方式进行特征提取,基于不同方法提取第一特征和第二特征以及具有特殊结构的预先训练的风险识别模型对目标用户进行风险识别,从而能够提高风险识别的准确性,及时实现风险拦截,维护互联网金融的安全。
附图说明
[0039]图1为一个实施例中风险用户识别方法的流程示意图;
[0040]图2为一个实施例中对各节点的属性进行聚合处理的示意图;
[0041]图3为一个实施例中风险识别模型的训练方法的流程示意图;
[0042]图4为一个实施例中为各节点标注类别标签的示意图;
[0043]图5为一个实施例中根据预设的比例筛选有特征点和无特征节点的示意图;
[0044]图6为一个实施例中根据样本关系图谱对风险识别模型进行训练的步骤的流程示意图;
[0045]图7为一个实施例中风险用户识别装置的结构框图;
[0046]图8为一个实施例中计算机设备的内部结构图。
具体实施方式
[0047]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0048]在其中一个实施例中,本申请提供的风险用户识别方法,可以应用于计算机设备,例如,计算机设备可以是终端或服务器等。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。具体地,计算机设备获取目标关系图谱,目标关系图谱为包含目标用户的关系图谱;对目标关系图谱中各节点的属性进行聚合,得到第一特征;利用基于图神经网络的深度学习算法对目标关系图谱中的各节点进行特征提取,得到第二特征;调用预先训练的风险识别模型,风险识别模型包括前馈神经网络单元和提升树单元,将第二特征输入前馈神经网络单元以得到中间分值,将中间分值和第一特征输入提升树单元以得到目标用户的风险识别结果。
[0049]在其中一个实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险用户识别方法,所述方法包括:获取目标关系图谱,所述目标关系图谱为包含目标用户的关系图谱;对所述目标关系图谱中各节点的属性进行聚合,得到第一特征;利用基于图神经网络的深度学习算法对所述目标关系图谱中的各节点进行特征提取,得到第二特征;调用预先训练的风险识别模型,所述风险识别模型包括前馈神经网络单元和提升树单元,将所述第二特征输入前馈神经网络单元以得到中间分值,将所述中间分值和所述第一特征输入所述提升树单元以得到所述目标用户的风险识别结果。2.根据权利要求1所述的方法,其特征在于,所述获取目标关系图谱的步骤,包括:调取历史用户的历史关联人信息;根据所述历史关联人信息将所述历史用户与所述目标用户进行反向关联,根据所述反向关联的结果构建所述目标关系图谱。3.根据权利要求1所述的方法,其特征在于,所述风险识别模型的训练方法,包括:获取历史关系图谱,所述历史关系图谱为由历史用户构成的关系图谱;为所述历史关系图谱中的各节点标注类别标签;其中,所述类别标签包括风险标签、优质标签和未知标签;从所述历史关系图谱中筛选节点以生成样本关系图谱;根据所述样本关系图谱对所述风险识别模型进行训练。4.根据权利要求3所述的方法,其特征在于,所述从所述历史关系图谱中筛选节点以生成样本关系图谱的步骤,包括:将所述历史关系图谱中的多个节点划分为有特征节点和无特征节点;对所述无特征节点进行欠采样处理;根据预设的比例筛选有特征点和无特征节点,根据筛选出的有特征节点和无特征节点生成所述样本关系图谱。5.根据权利要求3所述的方法,其特征在于,所述根据所述样本关系图谱对所述风险识别模型进行训练的步骤,包括:根据预设的关联度从所述样本关系图谱中提取样本子图;对所述样本子图中各节点的属性进行聚...

【专利技术属性】
技术研发人员:周学璟
申请(专利权)人:上海数禾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1