基于深度学习的欺诈交易识别方法、系统及存储介质技术方案

技术编号：19123045 阅读：19 留言：0更新日期：2018-10-10 05:40

本发明专利技术公开了一种基于深度学习的欺诈交易识别方法、系统及存储介质，该方法包括：获取训练样本，所述训练样本为用于建立欺诈交易检测模型的交易数据；构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练，并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类，以将训练样本划分为若干个群组；计算所有群组的质心，并分别计算各个群组与所述质心的汉明距离；根据所述计算的各个汉明距离确定各个群组的欺诈概率，以建立欺诈交易检测模型；获取待检测交易数据，并根据所述欺诈交易检测模型，分析待检测交易数据，以得出待检测交易数据的欺诈概率，从而识别出欺诈交易。本发明专利技术能够提高欺诈交易识别的准确性和合理性。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的欺诈交易识别方法、系统及存储介质
本专利技术涉及金融风险控制领域，尤其涉及一种基于深度学习的欺诈交易识别方法、系统及存储介质。
技术介绍
金融领域对交易风险控制的要求较高。在利用深度学习进行欺诈交易的识别中，目前一般采用监督学习算法训练检测模型，而用于训练检测模型的特征是基于有标签的历史交易数据而构造的，因此采用监督学习算法训练的检测模型，可以有效识别历史欺诈类型，而对缺乏欺诈样本的未知欺诈类型(比如未曾出现过或变种的欺诈交易)一般无能为力，这种后验性导致交易风险识别具有滞后性，准确性较低。另一方面，现有采用无监督学习算法来训练检测模型的方法，是利用K-Means算法或基于密度的聚类算法直接对数据进行聚类而将数据划分成若干个群组(没有经过降维)，这种聚类算法极易受数据噪声点的影响，且其本质是基于相似度的度量学习(metriclearning)，需预先根据经验人工定义样本之间的距离，对于高维特征的数据人工难以确定合适的相似度度量方法；而目前最常用的特征降维方法是主成分分析(PCA)，然而，PCA适应于线性且服从高斯分布的数据，实际应用中的数据基本是非线性的，故在实际应用中PCA并不能达到预期的降维效果甚至失效。因而，现有方式中，对于实际应用中的非线性高维特征数据，不管是直接进行聚类，或是通过PCA进行降维，最终都不能精确描述群组信息，从而影响欺诈交易识别的合理性。这就给欺诈交易的识别带来了挑战，说明现有识别欺诈交易的方法，无法应对复杂的实际情况。
技术实现思路
本专利技术的主要目的在于提供一种基于深度学习的欺诈交易识别方法，旨在解决现有欺诈交易识别...
基于深度学习的欺诈交易识别方法、系统及存储介质

【技术保护点】
1.一种基于深度学习的欺诈交易识别方法，其特征在于，所述方法包括：获取训练样本，所述训练样本为用于建立欺诈交易检测模型的交易数据；构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练，并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类，以将训练样本划分为若干个群组；计算所有群组的质心，并分别计算各个群组与所述质心的汉明距离；根据所述计算的各个汉明距离确定各个群组的欺诈概率，以建立欺诈交易检测模型；获取待检测交易数据，并根据所述欺诈交易检测模型，分析待检测交易数据，以得出待检测交易数据的欺诈概率，从而识别出欺诈交易。

【技术特征摘要】
1.一种基于深度学习的欺诈交易识别方法，其特征在于，所述方法包括：获取训练样本，所述训练样本为用于建立欺诈交易检测模型的交易数据；构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练，并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类，以将训练样本划分为若干个群组；计算所有群组的质心，并分别计算各个群组与所述质心的汉明距离；根据所述计算的各个汉明距离确定各个群组的欺诈概率，以建立欺诈交易检测模型；获取待检测交易数据，并根据所述欺诈交易检测模型，分析待检测交易数据，以得出待检测交易数据的欺诈概率，从而识别出欺诈交易。2.如权利要求1所述的基于深度学习的欺诈交易识别方法，其特征在于，所述构建堆叠的RBM神经网络结构并进行训练的步骤包括：设置所述堆叠的RBM神经网络结构的层数和每一层RBM神经网络的输出节点数；逐一训练所述每一层RBM神经网络，以确定各层RBM神经网络的参数；将训练完成的各层RBM神经网络进行堆叠。3.如权利要求2所述的基于深度学习的欺诈交易识别方法，其特征在于，所述逐一训练所述每一层RBM神经网络，以确定各层RBM神经网络的参数的步骤包括：确定所述训练样本的特征，并根据所述特征构建高维特征向量，由所述高维特征向量构成高维特征空间；基于所述高维特征空间，逐一训练所述每一层RBM神经网络，以确定各层RBM神经网络的参数。4.如权利要求3所述的基于深度学习的欺诈交易识别方法，其特征在于，所述基于所述高维特征空间，逐一训练所述每一层RBM神经网络，以确定各层RBM神经网络的参数的步骤包括：利用正态分布随机产生第一层RBM神经网络的参数初始值；利用所述高维特征空间的维度作为第一层RBM神经网络的输入节点数训练第一层RBM神经网络，训练时通过调整所述第一层RBM神经网络的参数初始值，得到第一层RBM神经网络的参数；在得到第N-1层RBM神经网络的参数后，利用正态分布随机产生第N层RBM神经网络的参数初始值；利用第N-1层RBM神经网络的输出节点数作为第N层RBM神经网络的输入节点数训练第N层神经网络，训练时通过调整所述第N层RBM神经网络的参数初始值，得到第N层RBM神经网络的参数，以得到各层RBM神经网络的参数，其中，N≥2。5.如权利要求2至4中任一项所述的基于深度学习的欺诈交易识别方法，其特征在于，所述每一层RBM神经网络包括可见层和隐藏层，所述每一层RBM神经网络的参数包括所述可见层和隐藏层之间的权重矩阵、可见层中可见节点的偏移量和隐藏层中隐藏节点的偏移量。6.如权利要求1所述的基于深度学习的欺诈交易识别方法...

【专利技术属性】
技术研发人员：许泰清，盛帅，张文慧，曾征，曾卓然，
申请(专利权)人：招商银行股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人