基于深度学习的欺诈交易识别方法、系统及存储介质技术方案

技术编号:19059937 阅读:34 留言:0更新日期:2018-09-29 12:47
本发明专利技术公开了一种基于深度学习的欺诈交易识别方法、系统及存储介质,该方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的RBM神经网络结构,并基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器;通过所述降维器对所述训练样本进行降维,并将经过降维得到的二元状态向量进行聚类,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以识别出欺诈交易。本发明专利技术能够提高欺诈交易识别的准确性,无需预先定义相似度度量方法,从而可降低难度和成本,且对样本数据的容忍度高。

【技术实现步骤摘要】
基于深度学习的欺诈交易识别方法、系统及存储介质
本专利技术涉及金融风险控制领域,尤其涉及一种基于深度学习的欺诈交易识别方法、系统及存储介质。
技术介绍
金融领域对交易风险控制的要求较高。在利用深度学习进行欺诈交易的识别中,目前一般采用监督学习算法训练检测模型,而用于训练检测模型的特征是基于有标签的历史交易数据而构造的,因此采用监督学习算法训练的检测模型,可以有效识别历史欺诈类型,而对缺乏欺诈样本的未知欺诈类型(比如未曾出现过或变种的欺诈交易)一般无能为力,这种后验性导致交易风险识别具有滞后性,准确性较低。另一方面,现有采用无监督学习算法进行欺诈交易识别时,一般采用K-Means算法或基于密度的聚类算法直接对数据进行聚类(没有经过降维),上述聚类算法的本质是基于相似度的度量学习(metriclearning),需预先根据经验人工定义样本之间的距离,然而,用于训练检测模型的特征属于高维特征,对于高维特征的数据人工难以确定合适的相似度度量方法,只能通过大量的实验确定合适的相似度,耗费大量的时间和人力;而目前常用的特征降维方法是主成分分析(PCA),PCA适应于线性且服从高斯分布的数据,实际应用中的数据基本是非线性的,很难满足PCA适用的条件,在实际中PCA并不能达到预期的降维效果甚至失效。总之,现有通过无监督学习算法进行欺诈交易识别的方式,难度和成本巨大,且对样本数据要求苛刻,实际应用中所提供的样本数据很难满足要求。
技术实现思路
本专利技术的主要目的在于提供一种基于深度学习的欺诈交易识别方法,旨在解决现有欺诈交易识别方法不够准确,难度和成本巨大,且对样本数据要求苛刻的技术问题。为实现上述目的,本专利技术提供一种基于深度学习的欺诈交易识别方法,所述方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构,并基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器;通过所述降维器对所述训练样本进行降维,并将经过降维得到的二元状态向量进行聚类,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以识别出欺诈交易。可选地,所述构建堆叠的RBM神经网络结构的步骤包括:设置所述堆叠的RBM神经网络结构的层数和每一层RBM神经网络的输出节点数。可选地,所述基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器的步骤包括:确定所述训练样本的特征,并根据所述特征构建高维特征向量,由所述高维特征向量构成高维特征空间;基于所述高维特征空间,逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络;将训练完成的各层RBM神经网络进行堆叠,生成降维器。可选地,所述基于所述高维特征空间,逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络的步骤包括:基于所述高维特征空间,通过逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络,以确定各层RBM神经网络的参数。可选地,所述基于所述高维特征空间,通过逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络,以确定各层RBM神经网络的参数的步骤包括:利用正态分布随机产生第一层RBM神经网络的参数初始值;利用所述高维特征空间的维度作为第一层RBM神经网络的输入节点数训练第一层RBM神经网络,训练时通过调整所述第一层RBM神经网络的参数初始值,得到第一层RBM神经网络的参数;在得到第N-1层RBM神经网络的参数后,利用正态分布随机产生第N层RBM神经网络的参数初始值;利用第N-1层RBM神经网络的输出节点数作为第N层RBM神经网络的输入节点数训练第N层神经网络,训练时通过调整所述第N层RBM神经网络的参数初始值,得到第N层RBM神经网络的参数,以得到各层RBM神经网络的参数,其中,N≥2。可选地,所述每一层RBM神经网络包括可见层和隐藏层,所述每一层RBM神经网络的参数包括所述可见层和隐藏层之间的权重矩阵、可见层中可见节点的偏移量和隐藏层中隐藏节点的偏移量。可选地,所述通过所述降维器对所述训练样本进行降维,并将经过降维得到的二元状态向量进行聚类的步骤包括:通过所述降维器,将所述训练样本映射为二元状态向量;将具有相同二元状态向量的训练样本归为同一群组,以使所述训练样本划分为若干个群组。可选地,所述根据所述欺诈交易检测模型,分析待检测交易数据,以识别出欺诈交易的步骤包括:将所述待检测交易数据,代入所述欺诈交易检测模型中依次进行降维和聚类,得到待检测交易群组;分析各个待检测交易群组对应的欺诈概率,根据分析的各个欺诈概率确定需加重审核的待检测交易群组,以识别出欺诈交易。此外,为实现上述目的,本专利技术还提供一种基于深度学习的欺诈交易识别系统,所述基于深度学习的欺诈交易识别系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的欺诈交易识别程序,所述基于深度学习的欺诈交易识别程序被所述处理器执行时实现如下步骤:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构,并基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器;通过所述降维器对所述训练样本进行降维,并将经过降维得到的二元状态向量进行聚类,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以识别出欺诈交易。此外,为实现上述目的,本专利技术还提供一种存储介质,所述存储介质上存储有基于深度学习的欺诈交易识别程序,所述基于深度学习的欺诈交易识别程序被处理器执行时实现如下步骤:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构,并基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器;通过所述降维器对所述训练样本进行降维,并将经过降维得到的二元状态向量进行聚类,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以识别出欺诈交易。本专利技术构建堆叠的RBM神经网络结构,基于无监督的高维数据样本对RBM神经网络结构进行训练,生成降维器;然后通过生成的降维器对无监督的高维数据样本进行降维,并将经过降维得到的二元状态向量进行聚类,这一过程无需预先定义相似度度量方法,降低了难度和成本,且对样本数据容忍度高,从而建立欺诈交易检测模型,用于分析待检测交易数据,实现了基于欺诈交易检测模型对待检测交易数据的降维和聚类,由此可得到具有鲜明特性的各个待检测交易群组,再对各个待检测交易群组进行欺诈风险识别,可以有效识别历史欺诈类型和未知欺诈类型的欺诈交易,提高了欺诈交易识别的准确性。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图;图2为本专利技术基于深度学习的欺诈交易识别方法第一实施例的流程示意图;图3为本专利技术涉及的3层RBM神经网络结构示意图;图4为本专利技术基于深度学习的欺诈交易识别方法第一实施例的细化流程示意图;图5为本专利技术涉及的每一层RBM神经网络的示意图;图6本专利技术基于深度学习的欺诈交易识别方法第二实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处本文档来自技高网...

【技术保护点】
1.一种基于深度学习的欺诈交易识别方法,其特征在于,所述方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构,并基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器;通过所述降维器对所述训练样本进行降维,并将经过降维得到的二元状态向量进行聚类,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以识别出欺诈交易。

【技术特征摘要】
1.一种基于深度学习的欺诈交易识别方法,其特征在于,所述方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构,并基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器;通过所述降维器对所述训练样本进行降维,并将经过降维得到的二元状态向量进行聚类,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以识别出欺诈交易。2.如权利要求1所述的基于深度学习的欺诈交易识别方法,其特征在于,所述构建堆叠的RBM神经网络结构的步骤包括:设置所述堆叠的RBM神经网络结构的层数和每一层RBM神经网络的输出节点数。3.如权利要求2所述的基于深度学习的欺诈交易识别方法,其特征在于,所述基于所述训练样本训练所述堆叠的RBM神经网络结构,生成降维器的步骤包括:确定所述训练样本的特征,并根据所述特征构建高维特征向量,由所述高维特征向量构成高维特征空间;基于所述高维特征空间,逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络;将训练完成的各层RBM神经网络进行堆叠,生成降维器。4.如权利要求3所述的基于深度学习的欺诈交易识别方法,其特征在于,所述基于所述高维特征空间,逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络的步骤包括:基于所述高维特征空间,通过逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络,以确定各层RBM神经网络的参数。5.如权利要求4所述的基于深度学习的欺诈交易识别方法,其特征在于,所述基于所述高维特征空间,通过逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络,以确定各层RBM神经网络的参数的步骤包括:利用正态分布随机产生第一层RBM神经网络的参数初始值;利用所述高维特征空间的维度作为第一层RBM神经网络的输入节点数训练第一层RBM神经网络,训练时通过调整所述第一层RBM神经网络的参数初始值,得到第一层RBM神经网络的参数;在得到第N-1层RBM神经网络的参数后,利用正态分布随机产生第N层RBM神经网络的参数初始值;利用第N-1层RBM神经网络的输出节点数作为第N层RBM神经网络的输入节点数训练第N层神经网络,训练时通过调整所述第N层RBM神经网络的参数初始值,得到第N层RBM神经网络的参数,以得到各层RB...

【专利技术属性】
技术研发人员:许泰清盛帅张文慧曾征曾卓然
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1