异常账户的分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39256712 阅读:8 留言:0更新日期:2023-10-30 12:08
本公开提供了一种异常账户的分类方法、装置、电子设备及存储介质,可以应用于大数据、信息安全技术领域。该异常账户的分类方法包括:获取待分类的M个第一账户的账户数据,账户数据包括交易数据和关联账户数据,交易数据用于表征第一账户的交易特征,关联账户数据用于表征与第一账户之间存在关联的第二账户的账户数据,M≥1;根据关联账户数据,计算第一账户的相对度数据,相对度数据用于表征第一账户的关联账户数目与第二账户的关联账户数目之间的相对差异;将M个交易数据和M个相对度数据输入训练好的目标分类模型,输出M个分类结果,分类结果用于表征第一账户数据是否异常,目标分类模型是利用半监督学习方法训练得到的。模型是利用半监督学习方法训练得到的。模型是利用半监督学习方法训练得到的。

【技术实现步骤摘要】
异常账户的分类方法、装置、电子设备及存储介质


[0001]本公开涉及大数据、信息安全
,具体涉及一种异常账户的分类方法、装置、电子设备及存储介质。

技术介绍

[0002]在异常账户识别场景中,现有技术一般通过半监督学习训练分类模型,之后,利用训练好的分类模型实现异常账户的识别。
[0003]在实现上述专利技术构思的过程中,专利技术人发现至少存在以下技术问题:相关技术没有对账户之间的具体交易关联关系进行分析,导致分类模型的准确率较低。

技术实现思路

[0004]鉴于上述问题,本公开提供了一种异常账户的分类方法、装置、电子设备及存储介质。
[0005]根据本公开的第一个方面,提供了一种异常账户的分类方法,包括:
[0006]获取待分类的M个第一账户的账户数据,其中,账户数据包括交易数据和关联账户数据,交易数据用于表征第一账户的交易特征,关联账户数据用于表征与第一账户之间存在关联的第二账户的账户数据,M≥1;
[0007]根据关联账户数据,计算第一账户的相对度数据,其中,相对度数据用于表征第一账户的关联账户数目与第二账户的关联账户数目之间的相对差异;以及
[0008]将M个交易数据和M个相对度数据输入训练好的目标分类模型,输出M个分类结果,其中,分类结果用于表征第一账户数据是否异常,目标分类模型是利用半监督学习方法训练得到的。
[0009]根据本公开的实施例,其中,根据关联账户数据,计算第一账户的相对度数据,包括:
[0010]确定第一账户的第一数量数据,其中,第一数量数据表征与第一账户之间存在交易行为的N个第二账户,N≥1;
[0011]根据关联账户数据,确定N个第二账户各自的第二数量数据,其中,第二数量数据表征与第二账户之间存在交易行为的其他账户的数量;以及
[0012]根据第一数量数据和N个第二数量数据,计算第一账户的相对度数据。
[0013]根据本公开的实施例,其中,根据第一数量数据和N个第二数量数据,计算第一账户的相对度数据,包括:
[0014]计算第一数量数据与每个第二数量数据的比值,得到N个数量比值;以及
[0015]将N个数量比值之和除以第一数量数据,得到第一账户的相对度数据。
[0016]根据本公开的实施例,其中,训练得到目标分类模型包括:
[0017]获取训练样本集,其中,训练样本集包括P个有标签样本和Q个无标签样本各自的训练账户数据,训练账户数据包括训练交易数据和训练关联账户数据,有标签样本表征已
经标记异常的账户样本,无标签样本表征未标记异常的账户样本,Q≥P≥1;
[0018]根据训练账户数据,计算P个有标签样本各自的第一训练相对度数据、Q个无标签样本各自的第二训练相对度数据;
[0019]利用(P+Q)个训练交易数据、P个第一训练相对度数据、Q个第二训练相对度数据,训练待训练的分类模型,直至损失函数满足预定条件,得到训练好的目标分类模型。
[0020]根据本公开的实施例,其中,损失函数包括有标签相对度损失项、无标签相对度损失项、有标签经验损失项;确定损失函数包括:
[0021]根据P个有标签样本的交叉熵损失和第一训练相对度数据,确定有标签相对度损失项;
[0022]根据Q个无标签样本的交叉熵损失和第二训练相对度数据,确定无标签相对度损失项;
[0023]根据P个有标签样本的标准标签和分类模型的预测结果,确定有标签经验损失项;以及
[0024]根据有标签经验损失项、无标签相对度损失项与第一权重参数的乘积、有标签相对度损失项与第二权重参数的乘积,确定损失函数。
[0025]根据本公开的实施例,其中,根据P个有标签样本的交叉熵损失和第一训练相对度数据,确定有标签相对度损失项包括:
[0026]针对每个有标签样本,根据有标签样本的标准标签和分类模型的预测结果,确定每个有标签样本的第一交叉熵损失;
[0027]针对每个有标签样本,将第一训练相对度数据与第一交叉熵损失相乘,得到针对每个有标签样本的第一乘积;
[0028]根据P个第一乘积之和,确定有标签相对度损失项。
[0029]根据本公开的实施例,其中,根据Q个无标签样本的交叉熵损失和第二训练相对度数据,确定无标签相对度损失项,包括:
[0030]根据第二训练相对度数据与采样阈值之间的比较关系,确定Q个无标签样本各自的相对度采样值,其中,相对度采样值用于筛选无标签样本;
[0031]针对每个无标签样本,根据无标签样本的软标签和分类模型的预测结果,确定每个无标签样本的第二交叉熵损失;
[0032]针对每个无标签样本,将相对度采样值与第二交叉熵损失相乘,得到针对每个无标签样本的第二乘积;
[0033]根据Q个第二乘积之和,确定无标签相对度损失项。
[0034]根据本公开的实施例,其中,根据第二训练相对度数据与采样阈值之间的比较关系,确定Q个无标签样本各自的相对度采样值,包括:
[0035]在确定第q个第二训练相对度数据大于采样阈值的情况下,将相对度采样值确定为1;
[0036]在确定第q个第二训练相对度数据小于或等于采样阈值的情况下,将相对度采样值确定为0,Q≥q≥1。
[0037]根据本公开的实施例,该方法还包括:
[0038]利用K近邻算法,根据P个有标签样本的标准标签,确定Q个无标签样本各自的软标
签。
[0039]本公开的第二方面提供了一种异常账户的分类装置,包括:
[0040]获取模块,用于获取待分类的M个第一账户的账户数据,其中,账户数据包括交易数据和关联账户数据,交易数据用于表征第一账户的交易特征,关联账户数据用于表征与目标账户之间存在交易行为的第二账户的账户数据,M≥1;
[0041]计算模块,用于根据关联账户数据,计算第一账户的相对度数据,其中,相对度数据用于表征第一账户的关联账户数目与第二账户的关联账户数目之间的相对差异;以及
[0042]分类模块,用于将M个交易数据和M个相对度信息数据输入训练好的目标分类模型,输出与M个分类结果,其中,分类结果用于表征第一账户数据是否异常,目标分类模型是利用半监督学习方法训练得到的。
[0043]本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述异常账户的分类方法。
[0044]本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述异常账户的分类方法。
[0045]本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述异常账户的分类方法。
[0046]在本公开的实施例中,通过获取待分类的账户数据,其中,账户数据包括交易数据和关联账户数据,根据关联账户数据计算账户的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常账户的分类方法,包括:获取待分类的M个第一账户的账户数据,其中,所述账户数据包括交易数据和关联账户数据,所述交易数据用于表征第一账户的交易特征,所述关联账户数据用于表征与所述第一账户之间存在关联的第二账户的账户数据,M≥1;根据所述关联账户数据,计算所述第一账户的相对度数据,其中,所述相对度数据用于表征所述第一账户的关联账户数目与所述第二账户的关联账户数目之间的相对差异;以及将M个所述交易数据和M个所述相对度数据输入训练好的目标分类模型,输出所述M个分类结果,其中,所述分类结果用于表征所述第一账户数据是否异常,所述目标分类模型是利用半监督学习方法训练得到的。2.根据权利要求1所述的方法,其中,所述根据所述关联账户数据,计算所述第一账户的相对度数据,包括:确定所述第一账户的第一数量数据,其中,所述第一数量数据表征与所述第一账户之间存在交易行为的N个第二账户,N≥1;根据所述关联账户数据,确定N个所述第二账户各自的第二数量数据,其中,所述第二数量数据表征与所述第二账户之间存在交易行为的其他账户的数量;以及根据所述第一数量数据和N个所述第二数量数据,计算所述第一账户的相对度数据。3.根据权利要求2所述的方法,其中,所述根据所述第一数量数据和N个所述第二数量数据,计算所述第一账户的相对度数据,包括:计算所述第一数量数据与每个所述第二数量数据的比值,得到N个数量比值;以及将N个所述数量比值之和除以所述第一数量数据,得到所述第一账户的相对度数据。4.根据权利要求1所述的方法,其中,训练得到所述目标分类模型包括:获取训练样本集,其中,所述训练样本集包括P个有标签样本和Q个无标签样本各自的训练账户数据,所述训练账户数据包括训练交易数据和训练关联账户数据,所述有标签样本表征已经标记异常的账户样本,无标签样本表征未标记异常的账户样本,Q≥P≥1;根据所述训练账户数据,计算P个有标签样本各自的第一训练相对度数据、Q个无标签样本各自的第二训练相对度数据;利用(P+Q)个所述训练交易数据、P个所述第一训练相对度数据、Q个所述第二训练相对度数据,训练待训练的分类模型,直至损失函数满足预定条件,得到训练好的所述目标分类模型。5.根据权利要求4所述的方法,其中,所述损失函数包括有标签相对度损失项、无标签相对度损失项、有标签经验损失项;确定所述损失函数包括:根据P个所述有标签样本的交叉熵损失和所述第一训练相对度数据,确定所述有标签相对度损失项;根据Q个所述无标签样本的交叉熵损失和所述第二训练相对度数据,确定所述无标签相对度损失项;根据P个所述有标签样本的标准标签和所述分类模型的预测结果,确定所述有标签经验损失项;以及根据所述有标签经验损失项、所述有标签相对度损失项与第一权重参数的乘积、所述无标签相对度损失项与第二权重参数的乘积,确定所述损失函数。
6.根据权利要求5所述的方法,其中,所述根据P个所述有标签样本的交叉...

【专利技术属性】
技术研发人员:陈李龙徐林嘉冯如卢健
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1