一种异常账户识别方法、装置、设备及存储介质制造方法及图纸

技术编号:37332922 阅读:24 留言:0更新日期:2023-04-21 23:10
本公开提供了一种异常账户识别方法、装置、设备及存储介质,涉及计算机技术领域。方法主要包括:获取原始特征数据,原始特征数据包括业务账户对应的特征数据,业务账户包括待识别账户和标注账户;根据对比学习模型,对原始特征数据中的时间类型特征数据进行特征编码,得到业务账户对应的高阶编码特征;根据自编码器模型,对原始特征数据中的统计类型特征数据和高阶编码特征进行特征提取,得到第一特征向量和第二特征向量,第一特征向量为待识别账户对应的特征向量,第二特征向量为标注账户对应的特征向量;根据第一特征向量和第二特征向量,对待识别账户进行识别,得到异常账户识别结果。结果。结果。

【技术实现步骤摘要】
一种异常账户识别方法、装置、设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种异常账户识别方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术的快速发展,各行各业的业务规模和账户规模均不断扩大,相应的,从业务中利用不法手段获取利益的异常账户也越来越多,因此,对于各个行业来说,识别异常账户都至关重要。
[0003]在现有技术中,主要依靠专家规则对异常账户进行识别。然而,异常账户获取利益的手段多种多样,专家需要对异常账户进行持续不断的研究,编写多套专家规则以适用于多种手段,这会消耗大量的人力和资源;另外,异常账户获取利益的手段不断升级,异常账户的特征也更加复杂,复杂的特征难以用专家规则刻画清楚,因此异常账户的识别精确度不高。

技术实现思路

[0004]本公开提供了一种异常账户识别方法、装置、设备及存储介质,以至少解决现有技术中存在的以上技术问题。
[0005]根据本公开的第一方面,提供了一种异常账户识别方法,该方法包括:获取原始特征数据,所述原始特征数据包括业务账户对应的特征数据,所述业务账户包括待识别账户和标注账户;根据对比学习模型,对所述原始特征数据中的时间类型特征数据进行特征编码,得到所述业务账户对应的高阶编码特征;根据自编码器模型,对所述原始特征数据中的统计类型特征数据和所述高阶编码特征进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量为待识别账户对应的特征向量,第二特征向量为标注账户对应的特征向量;根据所述第一特征向量和所述第二特征向量,对所述待识别账户进行识别,得到异常账户识别结果。
[0006]在一可实施方式中,所述根据对比学习模型,对所述原始特征数据中的时间类型特征数据进行特征编码,得到所述业务账户对应的高阶编码特征,包括:对所述时间类型特征数据进行特征变换,得到变换后时间类型特征数据;对每种所述时间类型特征数据,将所述时间类型特征数据与其对应的变换后时间类型特征数据作为正样本对,将所述时间类型特征数据与其他业务账户对应的时间类型特征数据作为负样本对;根据所述对比学习模型、所述正样本对和所述负样本对,构建每种所述时间类型特征数据对应的特征编码模型;根据所述特征编码模型和多任务损失函数,对所述时间类型特征数据进行特征编码,得到所述业务账户对应的高阶编码特征。
[0007]在一可实施方式中,所述对所述时间类型特征数据进行特征变换,得到变换后时间类型特征数据,包括:根据第一预设阈值,对所述时间类型特征数据中的特征值进行随机采样,得到待变换特征值;根据每种所述时间类型特征数据的特征值范围,对所述待变换特
征值进行变换,得到所述变换后时间类型特征数据。
[0008]在一可实施方式中,根据如下公式计算所述多任务损失函数:,其中,表示多任务损失函数,、、表示超参数,、、分别表示不同种类时间类型特征数据对应的特征编码模型的对比损失函数。
[0009]在一可实施方式中,所述对比学习模型的编码层包括门控循环单元GRU。
[0010]在一可实施方式中,所述根据自编码器模型,对所述原始特征数据中的统计类型特征数据和所述高阶编码特征进行特征提取,得到第一特征向量和第二特征向量,包括:根据所述自编码器模型和均方差损失函数,构建所述业务账户对应的特征提取模型;根据所述特征提取模型,对所述原始特征数据中的统计类型特征数据和所述高阶编码特征进行特征提取,得到所述第一特征向量和所述第二特征向量。
[0011]在一可实施方式中,所述根据所述第一特征向量和所述第二特征向量,对所述待识别账户进行识别,得到异常账户识别结果,包括:计算所述第一特征向量与所有所述第二特征向量的相似度,得到计算结果;统计大于第二预设阈值的计算结果的数量,得到统计结果;根据所述统计结果和所述标注账户的数量,计算所述第一特征向量对应的待识别账户与所有所述标注账户的整体相似度;所述整体相似度大于第三预设阈值,则将所述第一特征向量对应的待识别账户确定为异常账户。
[0012]根据本公开的第二方面,提供了一种异常账户识别装置,其特征在于,所述装置包括:获取模块,用于获取原始特征数据,所述原始特征数据包括业务账户对应的特征数据,所述业务账户包括待识别账户和标注账户;特征编码模块,用于根据对比学习模型,对所述原始特征数据中的时间类型特征数据进行特征编码,得到所述业务账户对应的高阶编码特征;特征提取模块,用于根据自编码器模型,对所述原始特征数据中的统计类型特征数据和所述高阶编码特征进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量为待识别账户对应的特征向量,第二特征向量为标注账户对应的特征向量;识别模块,用于根据所述第一特征向量和所述第二特征向量,对所述待识别账户进行识别,得到异常账户识别结果。
[0013]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
[0014]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
[0015]本公开的一种异常账户识别方法、装置、设备及存储介质,首先获取原始特征数据,原始特征数据包括业务账户对应的特征数据,业务账户包括待识别账户和标注账户,然后根据对比学习模型,对原始特征数据中的时间类型特征数据进行特征编码,得到业务账户对应的高阶编码特征,之后根据自编码器模型,对原始特征数据中的统计类型特征数据
和所述高阶编码特征进行特征提取,得到待识别账户对应的第一特征向量和标注账户对应的第二特征向量,最后根据第一特征向量和第二特征向量,对待识别账户进行识别,得到异常账户识别结果。由此,通过对比学习模型,学习原始特征数据中的时间类型特征数据,得到业务账户对应的高阶编码特征,高阶编码特征可以更加准确的表征业务账户在时间维度上的特点,且根据自编码器模型,对原始特征数据中的统计类型特征数据和高阶编码特征进行特征提取,得到的第一特征向量和第二特征向量可以表征业务账户更本质的特点,从而提高异常账户识别结果的准确率,另外,本公开的方法可以自动进行异常账户识别,减少了人力和资源的消耗。
[0016]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0017]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:在附图中,相同或对应的标号表示相同或对应的部分。
[0018]图1示出了本公开第一实施例一种异常账户识别方法的流程示意图;图2示出了本公开第二实施例一种异常账户识别方法的流程示意图;图3示出了本公开第二本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常账户识别方法,其特征在于,所述方法包括:获取原始特征数据,所述原始特征数据包括业务账户对应的特征数据,所述业务账户包括待识别账户和标注账户;根据对比学习模型,对所述原始特征数据中的时间类型特征数据进行特征编码,得到所述业务账户对应的高阶编码特征;根据自编码器模型,对所述原始特征数据中的统计类型特征数据和所述高阶编码特征进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量为待识别账户对应的特征向量,第二特征向量为标注账户对应的特征向量;根据所述第一特征向量和所述第二特征向量,对所述待识别账户进行识别,得到异常账户识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据对比学习模型,对所述原始特征数据中的时间类型特征数据进行特征编码,得到所述业务账户对应的高阶编码特征,包括:对所述时间类型特征数据进行特征变换,得到变换后时间类型特征数据;对每种所述时间类型特征数据,将所述时间类型特征数据与其对应的变换后时间类型特征数据作为正样本对,将所述时间类型特征数据与其他业务账户对应的时间类型特征数据作为负样本对;根据所述对比学习模型、所述正样本对和所述负样本对,构建每种所述时间类型特征数据对应的特征编码模型;根据所述特征编码模型和多任务损失函数,对所述时间类型特征数据进行特征编码,得到所述业务账户对应的高阶编码特征。3.根据权利要求2所述的方法,其特征在于,所述对所述时间类型特征数据进行特征变换,得到变换后时间类型特征数据,包括:根据第一预设阈值,对所述时间类型特征数据中的特征值进行随机采样,得到待变换特征值;根据每种所述时间类型特征数据的特征值范围,对所述待变换特征值进行变换,得到所述变换后时间类型特征数据。4.根据权利要求2所述的方法,其特征在于,根据如下公式计算所述多任务损失函数:,其中,表示多任务损失函数,、、表示超参数,、、分别表示不同种类时间类型特征数据对应的特征编码模型的对比损失函数。5.根据权利要求2所述的方法,其特征在于,所述对比学习模型的编码层包括门控循环单元GRU。6.根据权利要求1所述的方法,其特征在于,所述根据自编码器模型,对所述原始特征数据中的统计类...

【专利技术属性】
技术研发人员:王茸茸赵腊梅孙悦蔡准郭晓鹏
申请(专利权)人:北京芯盾时代科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1