【技术实现步骤摘要】
异常账户的分类方法、装置、电子设备及存储介质
[0001]本公开涉及大数据、信息安全
,具体涉及一种异常账户的分类方法、装置、电子设备及存储介质。
技术介绍
[0002]在异常账户识别场景中,现有技术一般通过半监督学习训练分类模型,之后,利用训练好的分类模型实现异常账户的识别。
[0003]在实现上述专利技术构思的过程中,专利技术人发现至少存在以下技术问题:相关技术没有对账户之间的具体交易关联关系进行分析,导致分类模型的准确率较低。
技术实现思路
[0004]鉴于上述问题,本公开提供了一种异常账户的分类方法、装置、电子设备及存储介质。
[0005]根据本公开的第一个方面,提供了一种异常账户的分类方法,包括:
[0006]获取待分类的M个第一账户的账户数据,其中,账户数据包括交易数据和关联账户数据,交易数据用于表征第一账户的交易特征,关联账户数据用于表征与第一账户之间存在关联的第二账户的账户数据,M≥1;
[0007]根据关联账户数据,计算第一账户的相对度数据,其中,相对度数据用于表征第一账户的关联账户数目与第二账户的关联账户数目之间的相对差异;以及
[0008]将M个交易数据和M个相对度数据输入训练好的目标分类模型,输出M个分类结果,其中,分类结果用于表征第一账户数据是否异常,目标分类模型是利用半监督学习方法训练得到的。
[0009]根据本公开的实施例,其中,根据关联账户数据,计算第一账户的相对度数据,包括:
[0010]确定第一账户的第一 ...
【技术保护点】
【技术特征摘要】
1.一种异常账户的分类方法,包括:获取待分类的M个第一账户的账户数据,其中,所述账户数据包括交易数据和关联账户数据,所述交易数据用于表征第一账户的交易特征,所述关联账户数据用于表征与所述第一账户之间存在关联的第二账户的账户数据,M≥1;根据所述关联账户数据,计算所述第一账户的相对度数据,其中,所述相对度数据用于表征所述第一账户的关联账户数目与所述第二账户的关联账户数目之间的相对差异;以及将M个所述交易数据和M个所述相对度数据输入训练好的目标分类模型,输出所述M个分类结果,其中,所述分类结果用于表征所述第一账户数据是否异常,所述目标分类模型是利用半监督学习方法训练得到的。2.根据权利要求1所述的方法,其中,所述根据所述关联账户数据,计算所述第一账户的相对度数据,包括:确定所述第一账户的第一数量数据,其中,所述第一数量数据表征与所述第一账户之间存在交易行为的N个第二账户,N≥1;根据所述关联账户数据,确定N个所述第二账户各自的第二数量数据,其中,所述第二数量数据表征与所述第二账户之间存在交易行为的其他账户的数量;以及根据所述第一数量数据和N个所述第二数量数据,计算所述第一账户的相对度数据。3.根据权利要求2所述的方法,其中,所述根据所述第一数量数据和N个所述第二数量数据,计算所述第一账户的相对度数据,包括:计算所述第一数量数据与每个所述第二数量数据的比值,得到N个数量比值;以及将N个所述数量比值之和除以所述第一数量数据,得到所述第一账户的相对度数据。4.根据权利要求1所述的方法,其中,训练得到所述目标分类模型包括:获取训练样本集,其中,所述训练样本集包括P个有标签样本和Q个无标签样本各自的训练账户数据,所述训练账户数据包括训练交易数据和训练关联账户数据,所述有标签样本表征已经标记异常的账户样本,无标签样本表征未标记异常的账户样本,Q≥P≥1;根据所述训练账户数据,计算P个有标签样本各自的第一训练相对度数据、Q个无标签样本各自的第二训练相对度数据;利用(P+Q)个所述训练交易数据、P个所述第一训练相对度数据、Q个所述第二训练相对度数据,训练待训练的分类模型,直至损失函数满足预定条件,得到训练好的所述目标分类模型。5.根据权利要求4所述的方法,其中,所述损失函数包括有标签相对度损失项、无标签相对度损失项、有标签经验损失项;确定所述损失函数包括:根据P个所述有标签样本的交叉熵损失和所述第一训练相对度数据,确定所述有标签相对度损失项;根据Q个所述无标签样本的交叉熵损失和所述第二训练相对度数据,确定所述无标签相对度损失项;根据P个所述有标签样本的标准标签和所述分类模型的预测结果,确定所述有标签经验损失项;以及根据所述有标签经验损失项、所述有标签相对度损失项与第一权重参数的乘积、所述无标签相对度损失项与第二权重参数的乘积,确定所述损失函数。
6.根据权利要求5所述的方法,其中,所述根据P个所述有标签样本的交叉...
【专利技术属性】
技术研发人员:陈李龙,徐林嘉,冯如,卢健,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。