一种基于类明确表示的一分类对抗性诈骗检测方法技术

技术编号：32904778 阅读：15 留言：0更新日期：2022-04-07 11:55

本发明专利技术公开了一种基于类明确表示的一分类对抗性诈骗检测方法，采用改进的自编码器和改进的生成对抗网络，包括四个阶段：第一阶段：基于正常行为数据提取初步特征，利用改进后的自编码器提取其数据特征；第二阶段：修改原始生成对抗网络的目标函数得到改进的生成对抗网络，利用改进的生成对抗网络生成伪异常行为数据；第三阶段：将正常用户行为数据和伪异常行为数据输入改进的自编码器中一同训练，用训练完成后的编码器对正常行为数据提取最终特征；第四阶段：用最终提取好的正常行为数据特征对改进的生成对抗网络进行训练，训练完成后得到的判别器作为诈骗检测器对诈骗进行检测。本发明专利技术的方法在诈骗检测的准确率和稳定性方面都有显著提高。面都有显著提高。面都有显著提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于类明确表示的一分类对抗性诈骗检测方法

[0001]本专利技术涉及数据处理
，尤其涉及一种基于类明确表示的一分类对抗性诈骗检测方法。

技术介绍

[0002]诈骗行为广泛存在于我们的生活中，在网络、电信、保险(健康、汽车等)索赔、银行(纳税申报单索赔、信用卡交易等)等方面的诈骗比比皆是，诈骗检测是目前亟待解决的重大问题。
[0003]在技术上，诈骗检测主要有以下技术问题：
[0004](1)诈骗行为一般具有适应性，类型多变。一些传统方法基于专家手动提取的鲁棒特征进行检测，一旦诈骗类型发生变化，之前的方法就不再适用。
[0005](2)诈骗行为数据量和数据维度大。随着数据量和数据维度的增大，传统方法的计算量指数级增长，计算成本过大。
[0006](3)诈骗行为的数据不易获取。很多新兴的机器学习方法对处理大数据量非常有优势，但机器学习方法需要大量数据支撑才能取得好的效果，而诈骗行为首先在整个社会行为中属于少数，诈骗行为中很大一部分也没有数据记录，因此行为数据的多样性和不平衡性也给诈骗检测带来了挑战。
[0007]许多传统机器学习方法，如一类最邻近法(OCNN)、一类高斯过程 (OCGP)和一类支持向量机(OCSVM)等已经可以成功地对诈骗进行检测，但这些传统方法一般是基于专家手动提取的鲁棒特征，一旦诈骗类型发生变化，之前的方法就不再适用，另外，能够获取到的诈骗者行为数据也比正常用户的行为数据少得多，行为数据的多样性和不平衡性，都使得传统机器学习方法不再适用，而无监督或半监...

【技术保护点】

【技术特征摘要】
1.一种基于类明确表示的一分类对抗性诈骗检测方法，其特征在于，采用改进的自编码器和改进的生成对抗网络，并包括四个阶段：第一阶段：基于正常行为数据做初步的特征提取，利用改进后的自编码器提取其数据鲁棒特征；第二阶段：修改原始生成对抗网络中生成器和判别器的目标函数得到改进的生成对抗网络，利用改进的生成对抗网络生成伪异常行为数据；第三阶段：将正常用户行为数据和伪异常行为数据输入改进的自编码器中一同训练，用训练完成后的编码器对正常行为数据做最终的特征提取；第四阶段：用最终提取好的正常行为数据特征对改进的生成对抗网络进行训练，训练完成后得到的判别器作为诈骗检测器对诈骗进行检测。所述的改进的自编码器是在自编码器的中间层加入中心损失函数，使得自编码器在编码时满足最小化类内距离和最大化类间距离；所述的改进的生成对抗网络中，生成器的损失函数为生成分布与定义的诈骗数据的理想分布的KL散度。2.根据权利要求1所述的基于类明确表示的一分类对抗性诈骗检测方法，其特征在于，第一阶段的具体过程为：用正常数据对自动编码器进行训练，并在其中间层加入中心损失，最小化类内距离；训练完成后通过编码器En1对原始正常数据进行编码得到其特征，并保留解码器De1模型权重。3.根据权利要求1所述的基于类明确表示的一分类对抗性诈骗检测方法，其特征在于，第二阶段的具体过程为：将原始生成对抗网络中生成器的损失函数修改为生成分布与定义的诈骗数据的理想分布的KL散度，并训练判别器；训练完成后将生成器生成的伪诈骗数据特征通过解码器De1从潜在特征空间还原到原始空间。4.根据权利要求1所述的基于类明确表示的一分类对抗性诈骗检测方法，其特征在于，第三阶段的具体过程为：在自动编码器的中间层加入最小化类内距离、最大化类间距离的损失函数，将伪诈骗行为数据作为参考数据和正常行为数据一同对自动编码器进行训练，并通过训练好的编码器En2得到正常行为数据的特征表示。5.根据权利要求1所述的基于类明确表示的一分类对抗性诈骗检测方法，其特征在于，第四阶段的具体过程为：用第三阶段提取正常行为数据的特征对改进的生成对抗网络进行训练，生成器生成的伪异常数据会逐渐向正常数据聚集，直到分布于其边缘，判别器不断训练提高分辨正常数据和生成的伪异常数据的能力，训练完成后得到的判别器作为诈骗检测器对诈骗进行检测。6.根据权利要求1所述的基于类明确表示的一分类对抗性诈骗检测方法，其特征在于，改进的自编码器的损失函数如公式(8)所示；L
AE
＝l
MSE
+l
latent
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)其中，l
...

【专利技术属性】
技术研发人员：彭海朋，赵洁，李丽香，任叶青，赵珊珊，李思睿，暴爽，范琳萱，孟寅，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人