建立风险识别模型的方法及对应装置制造方法及图纸

技术编号:35473283 阅读:18 留言:0更新日期:2022-11-05 16:20
本说明书实施例提供了一种建立风险识别模型的方法及对应装置。其中方法包括:获取利用用户的网络行为数据构建的异构网络图对应的图邻接矩阵,异构网络图包括节点和边,节点包括行为主体和行为对象,边依据行为主体和行为对象之间的行为关系确定;利用图邻接矩阵生成训练样本,以及对图邻接矩阵的特征值和/或特征向量进行扰动生成对抗样本;利用训练样本和对抗样本训练图神经网络,得到风险识别模型;其中训练目标包括:最小化图神经网络针对训练样本和对抗样本中的样本对象输出的识别结果与该样本对象被标注的标签之间的差异,样本对象包括节点或边。本申请能够有效提高风险识别模型的鲁棒性。识别模型的鲁棒性。识别模型的鲁棒性。

【技术实现步骤摘要】
建立风险识别模型的方法及对应装置


[0001]本说明书一个或多个实施例涉及人工智能
,尤其涉及一种建立风险识别模型的方法及对应装置。

技术介绍

[0002]在互联网技术日益发展的今天,用户在使用互联网的各种行为中出现各种风险。例如可能存在诸如网络交易诈骗、虚假兼职诈骗、网络交友诈骗等各种各样的欺诈形式。在实际的风险控制场景中,图神经网络模型是目前应用比较广泛的一种深度神经网络模型。图神经网络在对图结构中节点之间的关联关系进行建模方面表现出强大的学习和表征能力。基于图神经网络的风险识别模型可以降低风险控制的成本,减少风控决策对于专家的依赖,从而提高风险控制的效率。
[0003]然而研究表明图神经网络容易受到对抗攻击的干扰,通过对图结构或节点特征进行细微的扰动即可极大地改变风险识别模型的预测结果。因此,提高风险识别模型的鲁棒性成为目前亟待解决的问题之一。

技术实现思路

[0004]有鉴于此,本说明书一个或多个实施例公开了一种建立风险识别模型的方法及对应装置,以便于提高风险识别模型的鲁棒性。
[0005]根据第一方面,本公开提供了一种建立风险识别模型的方法,该方法包括:
[0006]获取利用用户的网络行为数据构建的异构网络图对应的图邻接矩阵,所述异构网络图包括节点和边,所述节点包括行为主体和行为对象,所述边依据行为主体和行为对象之间的行为关系确定;
[0007]利用所述图邻接矩阵生成训练样本,以及对所述图邻接矩阵的特征值和/或特征向量进行扰动生成对抗样本;
[0008]利用所述训练样本和所述对抗样本训练图神经网络,得到风险识别模型;其中训练目标包括:最小化所述图神经网络针对所述训练样本和对抗样本中的样本对象输出的识别结果与该样本对象被标注的标签之间的差异,所述样本对象包括节点或边。
[0009]根据本申请实施例中一可实现的方式,利用所述图邻接矩阵生成训练样本包括:
[0010]对所述图邻接矩阵进行特征分解,得到第一特征值和第一特征向量;
[0011]利用所述第一特征值和所述第一特征向量进行重构,得到第一图邻接矩阵;
[0012]将所述第一图邻接矩阵作为训练样本。
[0013]根据本申请实施例中一可实现的方式,对所述图邻接矩阵的特征值和/或特征向量进行扰动生成对抗样本包括:
[0014]对所述图邻接矩阵进行特征分解,得到第一特征值和第一特征向量;
[0015]对所述第一特征值添加扰动得到第二特征值,利用所述第二特征值和所述第一特征向量重构得到第二图邻接矩阵;
[0016]对所述第一特征向量添加扰动得到第二特征向量,利用所述第一特征值和所述第二特征向量重构得到第三图邻接矩阵;
[0017]将所述第二图邻接矩阵和/或所述第三图邻接矩阵作为对抗样本。
[0018]根据本申请实施例中一可实现的方式,对所述第一特征值添加扰动得到第二特征值包括:确定所述训练样本输入所述图神经网络得到的第一训练损失,利用所述第一训练损失对所述第一特征值的梯度生成特征值扰动,对所述第一特征值添加所述特征值扰动得到第二特征值;
[0019]对所述第一特征向量添加扰动得到第二特征向量包括:确定所述训练样本输入所述图神经网络得到的第一训练损失,利用所述第一训练损失对所述第一特征向量的梯度生成特征向量扰动,对所述第一特征向量添加所述特征向量扰动得到第二特征向量。
[0020]根据本申请实施例中一可实现的方式,利用所述第一训练损失对所述第一特征值的梯度生成特征值扰动包括:
[0021]利用生成特征值扰动,其中,g1为所述第一训练损失对所述第一特征值的梯度,所述ε1为预设的超参数,所述|| ||2为求取二次范数;
[0022]利用所述第一训练损失对所述第一特征向量的梯度生成特征向量扰动包括:
[0023]利用生成特征向量扰动,其中,g2为所述第一训练损失对所述第一特征向量的梯度,所述ε2为预设的超参数。
[0024]根据本申请实施例中一可实现的方式,利用所述训练样本和所述对抗样本训练图神经网络包括:
[0025]在每一轮迭代中确定总训练损失,所述总训练损失由第一训练损失、第二训练损失和第三训练损失确定,所述第一训练损失为所述训练样本输入所述图神经网络得到的训练损失,所述第二训练损失为所述第二图邻接矩阵输入所述图神经网络得到的训练损失,所述第三训练损失为所述第三图邻接矩阵输入所述图神经网络得到的训练损失;利用所述总训练损失的值更新所述图神经网络的模型参数,直至达到预设的训练结束条件。
[0026]根据本申请实施例中一可实现的方式,所述风险识别模型用以对所述异构网络图中的待识别节点或边进行风险识别。
[0027]第二方面,提供了一种建立风险识别模型的装置,该装置包括:
[0028]矩阵获取单元,被配置为获取利用用户的网络行为数据构建的异构网络图对应的图邻接矩阵,所述异构网络图包括节点和边,所述节点包括行为主体和行为对象,所述边依据行为主体和行为对象之间的行为关系确定;
[0029]样本生成单元,被配置为利用所述图邻接矩阵生成训练样本,以及对所述图邻接矩阵的特征值和/或特征向量进行扰动生成对抗样本;
[0030]模型训练单元,被配置为利用所述训练样本和所述对抗样本训练图神经网络,得到风险识别模型;其中训练目标包括:最小化所述图神经网络针对所述训练样本和对抗样本中的样本对象输出的识别结果与该样本对象被标注的标签之间的差异,所述样本对象包括节点或边。
[0031]根据第三方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,
当所述计算机程序在计算机中执行时,令计算机执行如上所述的方法。
[0032]根据第四方面,本公开提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现如上所述的方法。
[0033]根据本申请提供的具体实施例,本申请可以具备以下技术效果:
[0034]1)本申请通过对图邻接矩阵的特征值和/或特征向量进行扰动以生成对抗样本,以对图神经网络进行对抗训练,能够有效提高风险识别模型的鲁棒性。
[0035]2)本申请实际上是对图数据的谱域进行扰动生成对抗样本,避免了图的离散性问题,并且经过特征分解后,特征向量实际上进行了降维,因此大大减小了对抗训练的计算开销。
[0036]3)本申请中对抗样本的构造仍然基于图结构,因此训练得到的风险识别模型相比较基于特征扰动的对抗训练,能够更加有效地对抗扰动攻击,具有更好的鲁棒性。
附图说明
[0037]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1示出了可以应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建立风险识别模型的方法,其特征在于,该方法包括:获取利用用户的网络行为数据构建的异构网络图对应的图邻接矩阵,所述异构网络图包括节点和边,所述节点包括行为主体和行为对象,所述边依据行为主体和行为对象之间的行为关系确定;利用所述图邻接矩阵生成训练样本,以及对所述图邻接矩阵的特征值和/或特征向量进行扰动生成对抗样本;利用所述训练样本和所述对抗样本训练图神经网络,得到风险识别模型;其中训练目标包括:最小化所述图神经网络针对所述训练样本和对抗样本中的样本对象输出的识别结果与该样本对象被标注的标签之间的差异,所述样本对象包括节点或边。2.根据权利要求1所述的方法,其特征在于,利用所述图邻接矩阵生成训练样本包括:对所述图邻接矩阵进行特征分解,得到第一特征值和第一特征向量;利用所述第一特征值和所述第一特征向量进行重构,得到第一图邻接矩阵;将所述第一图邻接矩阵作为训练样本。3.根据权利要求1所述的方法,其特征在于,对所述图邻接矩阵的特征值和/或特征向量进行扰动生成对抗样本包括:对所述图邻接矩阵进行特征分解,得到第一特征值和第一特征向量;对所述第一特征值添加扰动得到第二特征值,利用所述第二特征值和所述第一特征向量重构得到第二图邻接矩阵;对所述第一特征向量添加扰动得到第二特征向量,利用所述第一特征值和所述第二特征向量重构得到第三图邻接矩阵;将所述第二图邻接矩阵和/或所述第三图邻接矩阵作为对抗样本。4.根据权利要求3所述的方法,其特征在于,对所述第一特征值添加扰动得到第二特征值包括:确定所述训练样本输入所述图神经网络得到的第一训练损失,利用所述第一训练损失对所述第一特征值的梯度生成特征值扰动,对所述第一特征值添加所述特征值扰动得到第二特征值;对所述第一特征向量添加扰动得到第二特征向量包括:确定所述训练样本输入所述图神经网络得到的第一训练损失,利用所述第一训练损失对所述第一特征向量的梯度生成特征向量扰动,对所述第一特征向量添加所述特征向量扰动得到第二特征向量。5.根据权利要求4所述的方法,其特征在于,利用所述第一训练损失对所述第一特征值的梯度生成特征值扰动包括:利用生成特...

【专利技术属性】
技术研发人员:李金膛陈亮田胜朱亮孟昌华王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1