当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于生成对抗网络的可信电子交易放行机制制造技术

技术编号:21549243 阅读:22 留言:0更新日期:2019-07-06 22:14
一种基于生成对抗网络的可信电子交易放行机制,其特征在于,本发明专利技术改以逆向思路考虑采用大量的非欺诈数据利用生成对抗网络来学习正常用户的交易分布,得到的判别模型能够较好的识别非欺诈数据,这样就能对可信的电子交易采取放行机制,剩下的无法判别的数据再交给预测模型来做预测就能节省大量的时间。

A Trusted Electronic Transaction Release Mechanism Based on Generating Countermeasure Network

【技术实现步骤摘要】
一种基于生成对抗网络的可信电子交易放行机制
本专利技术涉及互联网金融网络支付的反欺诈检测。
技术介绍
移动互联网是一柄双刃剑,在给人们生活带来便利的同时随之也带来了种种隐患,例如线上交易的支付平台可以让人足不出户的甚至随时随地的就可以进行购物以及支付,但是这种便利和快捷也让一些不法的攻击者有机可乘,攻击者通过窃取用户的账户信息,盗取用户的个人隐私信息,甚至伪装成用户本身进行交易或者转账来完成欺诈。因此为了有效的保障用户以及公司的个人利益安全,需要建立切实有效的网络支付欺诈检测系统。在互联网金融的交易数据中,通常欺诈的数据是占特别少的比率的,因为大部分的用户的交易是正常的,只有那些极少的一部分是欺诈,而在这个领域中绝大部分的方法是去抓贼,即预测欺诈数据,但是预测的过程通常是非常耗时的,我们知道,时间就是损失,能越快的找到欺诈交易就能越早的避免用户的损失,针对预测模型比较耗时的这个过程,并且在欺诈与非欺诈数据极度不均衡的这种情况下要训练出一个可以预测欺诈交易的模型几乎是不可能的。
技术实现思路
本专利技术改以逆向思路考虑采用大量的非欺诈数据利用生成对抗网络来学习正常用户的交易分布,得到的判别模型能够较好的识别非欺诈数据,这样就能对可信的电子交易采取放行机制,剩下的无法判别的数据再交给预测模型来做预测就能节省大量的时间。具体实现,技术方案为:依次包括四个步骤:1.预处理;2.建模;3.训练;4.放行;所述建模生成对抗网络GAN,包含生成模型G、判别模型D,两个模型的作用:生成模型G:不断学习训练集中的真实数据的概率分布,目标是将输入的随机噪声转换成可以以假乱真的数据;判别模型D:判断一条记录是否是真实的数据,目标是将生成模型G产生的“假”的数据与数据中的“真”数据区分开。所述训练训练的过程首先是将真实数据标记为1,随机生成的数据标记为0,同时放到判别模型D中去训练,更新D中的参数,然后将损失函数中的损失反馈给生成模型G,调整G中的参数,然后开始训练G,两个模型的训练交替进行,直到最后的模型收敛。所述放行将已经收敛的生成对抗网络中的生成模型G单独拿出来,作为样本生成器,而将判别模型D单独拿出来,作为分类判别器用于对预测数据进行判定并将确定出的非欺诈数据予以放行。进一步公开,本专利技术模型结构为:包括生成模型G、判别模型D,所述生成模型G输出连接判别模型D的输入;首先生成模型G的结构设计如下:预处理完的每一条记录均为一个30维的向量,因此输入层采用30个神经元的LSTM层,然后是一个包含100个神经元的全连接层,后续连接一个包含100个神经元的LSTM层,接着是一个包含30个神经元的全连接层,采用softmax作为激活函数,整个生成模型采用交叉熵作为损失函数;而判别模型D的结构设计如下:输入层为包含30个神经元的全连接层,接下来是一个包含200个神经元的LSTM层,然后是一个包含100个神经元的全连接层,后续连接一个包含100个神经元的LSTM层,最后是一个包含2个神经元的全连接层,整个判别模型采用交叉熵作为损失函数。接下来的训练过程通过相互竞争让这两个模型同时得到增强。由于判别模型D的存在,使得G在没有大量先验知识以及先验分布的前提下也能很好的去学习逼近真实数据,并最终让模型生成的数据达到以假乱真的效果(即D无法区分G生成的数据与真实数据,从而G和D达到某种纳什均衡)。上述技术方案提出了基于生成对抗网络的可信电子交易的放行机制,在不丢失信息量的情况下,并且在欺诈与非欺诈数据极度不均衡导致无法训练出正常的预测模型时,利用大量的非欺诈数据训练得到的生成对抗网络能对可信的交易数据采取放行机制。得益于当前互联网金融产生的丰富交易信息数据,我们可以分析并以此作为基础,设计反欺诈检测系统,保护用户和企业的安全。附图说明图1本专利技术基于生成对抗网络的可信电子交易放行机制系统结构图;图2本专利技术基于生成对抗网络的可信电子交易放行机制模型。图3判别模型D和生成模型G博弈示意图。图4生成模型G的结构。图5判别模型D的结构。具体实施方式本专利技术在现有的生成对抗网络的框架下融入了长短期记忆网络(LongShortTermMemory),即生成对抗网络中的生成模型和判别模型分别为两个不同的LSTM神经网络,生成对抗网络在图像生成等领域有着重要的作用,而LSTM在自然语言处理等领域发挥着重要的作用,但目前还未见有文献将生成对抗网络与LSTM融合并用在互联网金融数据的反欺诈研究上。关于生成对抗网络以及LSTM的具体结构后文有详细介绍,本专利技术的生成对抗网络的线上交易欺诈实时检测方法四个模块,它们分别是:1.预处理;2.建模;3.训练;4.放行。下面介绍每一个模块的主要功能。1.预处理虽然目前的互联网金融已经产生了许多丰富的交易数据,但是基于现实世界中的数据大体上都是不完整的不一致的脏数据,无法直接参与模型的计算,因此我们必须对原始的数据进行预处理。(1)数据清理:通过填写缺失值,光滑噪声数据,识别或解决不一致的清理数据。主要是达到以下的目标:数据的格式化标准(如时间等),异常数据的清除,错误纠正,重复数据的清除;(2)数据集成:数据集成主要是将多个数据源中的数据结合起来并统一存储,建立数据仓库;(3)数据变换:通过平滑聚集,数据概化,规范化等方式将数据转换成学习模型需要的形式。2.建模生成对抗网络(GenerativeAdversarialNetworks)简称GAN,其中包含两个重要的模型,即一个是生成模型G,另一个是判别模型D,两个模型的作用:(1)生成模型G:不断学习训练集中的真实数据的概率分布,目标是将输入的随机噪声转换成可以以假乱真的数据(生成的数据与真实数据越相似越好)。(2)判别模型D:判断一条记录是否是真实的数据,目标是将生成模型G产生的“假”的数据与数据中的“真”数据区分开。现有的GAN的实现方法是让D和G进行博弈如图3所示,而本专利技术的模型是在现有的GAN的框架下,对模型本身做了改变,本专利技术模型结构具体表征为:包括生成模型G、判别模型D,所述生成模型G输出连接判别模型D的输入;所述生成模型G包括依次连接的第一LSTM层、第一全连接层、第二LSTM层、第二全连接层;所述第一LSTM层为输入层,包括30个神经元,其输出连接第一全连接层;所述第一全连接层包含100个神经元,其输出连接第二LSTM层;所述第二LSTM层包含100个神经元,其输出连接第二全连接层;所述第二全连接层包含2个神经元,其共同输出连接判别模型D的输入,具体结构为图4所示。所述判别模型D包括依次连接的第一全连接层、第一LSTM层、第二全连接层、第二全LSTM层、第三全连接层;所述第一全连接层为输入层,包括30个神经元,其输出连接第一LSTM层;所述第一LSTM层包含200个神经元,其输出连接第二全连接层;所述第二全连接层包含100个神经元,其输出连接第二LSTM层;所述第二LSTM层包含100个神经元,其输出连接第三全连接层;所述第三全连接层包含2个神经元,其共同输出为判别模型D的输出,具体结构为图5所示。首先生成模型G的结构设计如下:预处理完的每一条记录均为一个30维的向量,因此输入层采用30个神经元的LSTM层,然后是一个包含100个神经元的全连接层,后续连接一个本文档来自技高网...

【技术保护点】
1.一种基于生成对抗网络的可信电子交易放行机制,其特征在于,采用大量的非欺诈数据利用生成对抗网络来学习正常用户的交易分布,得到的判别模型能够较好的识别非欺诈数据,这样就能对可信的电子交易采取放行机制。

【技术特征摘要】
1.一种基于生成对抗网络的可信电子交易放行机制,其特征在于,采用大量的非欺诈数据利用生成对抗网络来学习正常用户的交易分布,得到的判别模型能够较好的识别非欺诈数据,这样就能对可信的电子交易采取放行机制。2.如权利要求1所述的基于生成对抗网络的可信电子交易放行机制,其特征在于,依次包括四个步骤:1.预处理;2.建模;3.训练;4.放行;所述建模生成对抗网络GAN,包含生成模型G、判别模型D,两个模型的作用:生成模型G:不断学习训练集中的真实数据的概率分布,目标是将输入的随机噪声转换成可以以假乱真的数据;判别模型D:判断一条记录是否是真实的数据,目标是将生成模型G产生的“假”的数据与数据中的“真”数据区分开。所述训练训练的过程首先是将真实数据标记为1,随机生成的数据标记为0,同时放到判别模型D中去训练,更新D中的参数,然后将损失函数中的损失反馈给生成模型G,调整G中的参数,然后开始训练G,两个模型的训练交替进行,直到最后的模型收敛。所述放行将已经收敛的生成对抗网络中的生成模型G单独拿出来,作为样本生成器,而将判别模型D单独拿出来,作为分类判别器用于对预测数据进行判定并将确定出的非欺诈数据予以放行。3.如权利要求2所述的基于生成对抗网络的可信电子交易放行机制,其特征在于,对抗...

【专利技术属性】
技术研发人员:王成胡腾
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1