【技术实现步骤摘要】
一种带噪声学习的负样本对抗生成方法
本专利技术涉及一种电子交易负样本生成方法,属于信息
技术介绍
随着现代科学技术的高速发展,互联网金融成为当下最热的话题。互联网金融与人们的日常生活息息相关,目前俨然成为行业发展的主流方向。数据统计显示,2016年完成非现金交易3687.24万亿元;2017年,共完成非现金交易3759.94万亿元,其中移动支付交易规模近150万亿元,居全球首位。截至2019年6月,我国网络支付用户规模达6.33亿,较2018年底增长3265万,占网民整体的74.1%。金融高速发展的同时,以银行、电子消费等为代表的各领域交易欺诈案件日益增加,欺诈手段层出不穷。2019年,《中国互联网络发展状况统计报告》指出上半年遭遇网络诈骗的网民为21.5%,在网络诈骗各种类型中,虚拟中奖信息诈骗仍是网民最常遇到的网络诈骗类型,网络兼职诈骗排名第二。在使用深度学习或机器学习方法构建欺诈检测模型时,样本不均衡、数据集高度倾斜问题普遍存在。以电子银行为例,每天交易流水在百万甚至千万量级,然而在交易记录里只有少数 ...
【技术保护点】
1.一种带噪声学习的负样本对抗生成方法,其特征在于,基于该模型,模型采用自动编码器结合生成对抗网络的结构,包括编码器E、解码生成器G和判别器D,其中,编码器对输入的每一条交易数据学习其欺诈特征模式,进行压缩编码后,得到输入交易的特征空间z;将自动编码器中的解码器和生成对抗网络中的生成器结构合二为一,两个网络共享权值参数,形成解码生成器G,解码生成器G一方面完成输出样本尽可能接近原始样本的任务,另一方面完成从潜在特征空间到样本空间的映射任务;解决输入噪声不具有任何先验学习信息的问题,让输入的噪声更具有学习能力。判别器D是一个分类器模型,判别器D不仅会读取原始数据,标记为tru ...
【技术特征摘要】
1.一种带噪声学习的负样本对抗生成方法,其特征在于,基于该模型,模型采用自动编码器结合生成对抗网络的结构,包括编码器E、解码生成器G和判别器D,其中,编码器对输入的每一条交易数据学习其欺诈特征模式,进行压缩编码后,得到输入交易的特征空间z;将自动编码器中的解码器和生成对抗网络中的生成器结构合二为一,两个网络共享权值参数,形成解码生成器G,解码生成器G一方面完成输出样本尽可能接近原始样本的任务,另一方面完成从潜在特征空间到样本空间的映射任务;解决输入噪声不具有任何先验学习信息的问题,让输入的噪声更具有学习能力。判别器D是一个分类器模型,判别器D不仅会读取原始数据,标记为true,还会将解码生成器G生成的数据作为输入,标记为false,给出true或者false的结果,所述对抗样本生成方法包括以下步骤:
步骤1、依据数据集中带标签样本的标签,将所有带标签样本划分为不同的样本数据集,通过数据抽取方法从交易负样本数据中抽取出负样本数据集;
步骤2、建立模型,并利用上一步获得的负样本数据集对模型进行训练,包括以下步骤:
S201、初始化模型
获取上一步得到的交易负样本数据集,作为模型中编码器E和判别器D的输入;设置模型的网络层数、节点数、激活函数、梯度训练函数,对模型的参数训练次数、网络权值、偏置值、学习率初始化后,构建初始的模型;
S202、模型训练
根据给定的训练次数、迭代方案、优化目标,对模型进行对抗训练,编码器E、解码生成器G和判别器D的优化目标分别表示为:
编码器E优化目标:
式中,LEncoder表示编码器损失、X表示原始数据、E=E(X)表示通过编码器重建的样本;
判别器优化:
式中,表示损失函数,x表示生成数据或样本数据、D=D(x)表示判别器输出,pdata表示真实数据分布,表示真实数据下的损失,pz表示生成数据分布,z表示随机噪声,G(z)表示生成数据样本,D(G(z))表示判别器对生成样本的区分,G(E(X))表示编码器指导下生成样本,D(G(E(X)))表示判别器对G(E(X))的区分,...
【专利技术属性】
技术研发人员:章昭辉,蒋昌俊,王鹏伟,杨丽俊,
申请(专利权)人:东华大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。