基于深度学习的欺诈交易识别方法、系统及存储介质技术方案

技术编号：19059937 阅读：34 留言：0更新日期：2018-09-29 12:47

本发明专利技术公开了一种基于深度学习的欺诈交易识别方法、系统及存储介质，该方法包括：获取训练样本，所述训练样本为用于建立欺诈交易检测模型的交易数据；构建堆叠的RBM神经网络结构，并基于所述训练样本训练所述堆叠的RBM神经网络结构，生成降维器；通过所述降维器对所述训练样本进行降维，并将经过降维得到的二元状态向量进行聚类，以建立欺诈交易检测模型；获取待检测交易数据，并根据所述欺诈交易检测模型，分析待检测交易数据，以识别出欺诈交易。本发明专利技术能够提高欺诈交易识别的准确性，无需预先定义相似度度量方法，从而可降低难度和成本，且对样本数据的容忍度高。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的欺诈交易识别方法、系统及存储介质
本专利技术涉及金融风险控制领域，尤其涉及一种基于深度学习的欺诈交易识别方法、系统及存储介质。
技术介绍
金融领域对交易风险控制的要求较高。在利用深度学习进行欺诈交易的识别中，目前一般采用监督学习算法训练检测模型，而用于训练检测模型的特征是基于有标签的历史交易数据而构造的，因此采用监督学习算法训练的检测模型，可以有效识别历史欺诈类型，而对缺乏欺诈样本的未知欺诈类型(比如未曾出现过或变种的欺诈交易)一般无能为力，这种后验性导致交易风险识别具有滞后性，准确性较低。另一方面，现有采用无监督学习算法进行欺诈交易识别时，一般采用K-Means算法或基于密度的聚类算法直接对数据进行聚类(没有经过降维)，上述聚类算法的本质是基于相似度的度量学习(metriclearning)，需预先根据经验人工定义样本之间的距离，然而，用于训练检测模型的特征属于高维特征，对于高维特征的数据人工难以确定合适的相似度度量方法，只能通过大量的实验确定合适的相似度，耗费大量的时间和人力；而目前常用的特征降维方法是主成分分析(PCA)，PCA适应于线性且服从高斯分布的数据，实际应用中的数据基本是非线性的，很难满足PCA适用的条件，在实际中PCA并不能达到预期的降维效果甚至失效。总之，现有通过无监督学习算法进行欺诈交易识别的方式，难度和成本巨大，且对样本数据要求苛刻，实际应用中所提供的样本数据很难满足要求。
技术实现思路
本专利技术的主要目的在于提供一种基于深度学习的欺诈交易识别方法，旨在解决现有欺诈交易识别方法不够准确，难度和成本巨大，且对样本数据要求苛...

【技术保护点】
1.一种基于深度学习的欺诈交易识别方法，其特征在于，所述方法包括：获取训练样本，所述训练样本为用于建立欺诈交易检测模型的交易数据；构建堆叠的受限玻尔兹曼机RBM神经网络结构，并基于所述训练样本训练所述堆叠的RBM神经网络结构，生成降维器；通过所述降维器对所述训练样本进行降维，并将经过降维得到的二元状态向量进行聚类，以建立欺诈交易检测模型；获取待检测交易数据，并根据所述欺诈交易检测模型，分析待检测交易数据，以识别出欺诈交易。

【技术特征摘要】
1.一种基于深度学习的欺诈交易识别方法，其特征在于，所述方法包括：获取训练样本，所述训练样本为用于建立欺诈交易检测模型的交易数据；构建堆叠的受限玻尔兹曼机RBM神经网络结构，并基于所述训练样本训练所述堆叠的RBM神经网络结构，生成降维器；通过所述降维器对所述训练样本进行降维，并将经过降维得到的二元状态向量进行聚类，以建立欺诈交易检测模型；获取待检测交易数据，并根据所述欺诈交易检测模型，分析待检测交易数据，以识别出欺诈交易。2.如权利要求1所述的基于深度学习的欺诈交易识别方法，其特征在于，所述构建堆叠的RBM神经网络结构的步骤包括：设置所述堆叠的RBM神经网络结构的层数和每一层RBM神经网络的输出节点数。3.如权利要求2所述的基于深度学习的欺诈交易识别方法，其特征在于，所述基于所述训练样本训练所述堆叠的RBM神经网络结构，生成降维器的步骤包括：确定所述训练样本的特征，并根据所述特征构建高维特征向量，由所述高维特征向量构成高维特征空间；基于所述高维特征空间，逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络；将训练完成的各层RBM神经网络进行堆叠，生成降维器。4.如权利要求3所述的基于深度学习的欺诈交易识别方法，其特征在于，所述基于所述高维特征空间，逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络的步骤包括：基于所述高维特征空间，通过逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络，以确定各层RBM神经网络的参数。5.如权利要求4所述的基于深度学习的欺诈交易识别方法，其特征在于，所述基于所述高维特征空间，通过逐一训练所述堆叠的RBM神经网络结构中的每一层RBM神经网络，以确定各层RBM神经网络的参数的步骤包括：利用正态分布随机产生第一层RBM神经网络的参数初始值；利用所述高维特征空间的维度作为第一层RBM神经网络的输入节点数训练第一层RBM神经网络，训练时通过调整所述第一层RBM神经网络的参数初始值，得到第一层RBM神经网络的参数；在得到第N-1层RBM神经网络的参数后，利用正态分布随机产生第N层RBM神经网络的参数初始值；利用第N-1层RBM神经网络的输出节点数作为第N层RBM神经网络的输入节点数训练第N层神经网络，训练时通过调整所述第N层RBM神经网络的参数初始值，得到第N层RBM神经网络的参数，以得到各层RB...

【专利技术属性】
技术研发人员：许泰清，盛帅，张文慧，曾征，曾卓然，
申请(专利权)人：招商银行股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人