基于深度学习的欺诈交易识别方法、系统及存储介质技术方案

技术编号:19123045 阅读:19 留言:0更新日期:2018-10-10 05:40
本发明专利技术公开了一种基于深度学习的欺诈交易识别方法、系统及存储介质,该方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练,并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。本发明专利技术能够提高欺诈交易识别的准确性和合理性。

【技术实现步骤摘要】
基于深度学习的欺诈交易识别方法、系统及存储介质
本专利技术涉及金融风险控制领域,尤其涉及一种基于深度学习的欺诈交易识别方法、系统及存储介质。
技术介绍
金融领域对交易风险控制的要求较高。在利用深度学习进行欺诈交易的识别中,目前一般采用监督学习算法训练检测模型,而用于训练检测模型的特征是基于有标签的历史交易数据而构造的,因此采用监督学习算法训练的检测模型,可以有效识别历史欺诈类型,而对缺乏欺诈样本的未知欺诈类型(比如未曾出现过或变种的欺诈交易)一般无能为力,这种后验性导致交易风险识别具有滞后性,准确性较低。另一方面,现有采用无监督学习算法来训练检测模型的方法,是利用K-Means算法或基于密度的聚类算法直接对数据进行聚类而将数据划分成若干个群组(没有经过降维),这种聚类算法极易受数据噪声点的影响,且其本质是基于相似度的度量学习(metriclearning),需预先根据经验人工定义样本之间的距离,对于高维特征的数据人工难以确定合适的相似度度量方法;而目前最常用的特征降维方法是主成分分析(PCA),然而,PCA适应于线性且服从高斯分布的数据,实际应用中的数据基本是非线性的,故在实际应用中PCA并不能达到预期的降维效果甚至失效。因而,现有方式中,对于实际应用中的非线性高维特征数据,不管是直接进行聚类,或是通过PCA进行降维,最终都不能精确描述群组信息,从而影响欺诈交易识别的合理性。这就给欺诈交易的识别带来了挑战,说明现有识别欺诈交易的方法,无法应对复杂的实际情况。
技术实现思路
本专利技术的主要目的在于提供一种基于深度学习的欺诈交易识别方法,旨在解决现有欺诈交易识别方法不够准确与合理的技术问题。为实现上述目的,本专利技术提供一种基于深度学习的欺诈交易识别方法,所述方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练,并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。可选地,所述构建堆叠的RBM神经网络结构并进行训练的步骤包括:设置所述堆叠的RBM神经网络结构的层数和每一层RBM神经网络的输出节点数;逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数;将训练完成的各层RBM神经网络进行堆叠。可选地,所述逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数的步骤包括:确定所述训练样本的特征,并根据所述特征构建高维特征向量,由所述高维特征向量构成高维特征空间;基于所述高维特征空间,逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数。可选地,所述基于所述高维特征空间,逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数的步骤包括:利用正态分布随机产生第一层RBM神经网络的参数初始值;利用所述高维特征空间的维度作为第一层RBM神经网络的输入节点数训练第一层RBM神经网络,训练时通过调整所述第一层RBM神经网络的参数初始值,得到第一层RBM神经网络的参数;在得到第N-1层RBM神经网络的参数后,利用正态分布随机产生第N层RBM神经网络的参数初始值;利用第N-1层RBM神经网络的输出节点数作为第N层RBM神经网络的输入节点数训练第N层神经网络,训练时通过调整所述第N层RBM神经网络的参数初始值,得到第N层RBM神经网络的参数,以得到各层RBM神经网络的参数,其中,N≥2。可选地,所述每一层RBM神经网络包括可见层和隐藏层,所述每一层RBM神经网络的参数包括所述可见层和隐藏层之间的权重矩阵、可见层中可见节点的偏移量和隐藏层中隐藏节点的偏移量。可选地,所述通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组的步骤包括:通过所述训练完成的RBM神经网络结构,将所述训练样本映射为二元状态向量;将具有相同二元状态向量的训练样本归为同一群组,以将所述训练样本划分为若干个群组。可选地,所述根据所述计算的各个汉明距离确定各个群组的欺诈概率的步骤包括:将所述计算的各个汉明距离与预设汉明距离阈值进行比对;将汉明距离大于预设汉明距离阈值的群组,设置为高欺诈概率。可选地,所述根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易的步骤包括:将所述待检测交易数据,代入所述欺诈交易检测模型中,得到待检测交易数据基于群组的欺诈概率;加重审核高欺诈概率对应群组中的待检测交易数据,以识别出欺诈交易。此外,为实现上述目的,本专利技术还提供一种基于深度学习的欺诈交易识别系统,所述基于深度学习的欺诈交易识别系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的欺诈交易识别程序,所述基于深度学习的欺诈交易识别程序被所述处理器执行时实现如下步骤:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练,并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。此外,为实现上述目的,本专利技术还提供一种存储介质,所述存储介质上存储有基于深度学习的欺诈交易识别程序,所述基于深度学习的欺诈交易识别程序被处理器执行时实现如下步骤:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练,并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。本专利技术构建堆叠的RBM神经网络结构并进行训练,通过训练完成的RBM神经网络结构将无监督的高维数据样本进行降维和聚类,将样本划分为具有鲜明特性的各个群组,然后计算样本所有群组的质心,分别计算各个样本群组与所述质心的汉明距离,从而利用汉明距离衡量群组之间的距离,进而基于汉明距离确定各个样本群组的欺诈概率,由此建立欺诈交易检测模型,用于分析待检测交易数据,实现了基于欺诈交易检测模型确定待检测交易数据对应的欺诈概率,为有效识别历史欺诈类型和未知欺诈类型的欺诈交易提供了精确的分析依据,提高了欺诈交易识别的准确性和合理性。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图;图2为本专利技术基于深度学习的欺诈交易识别方法第一实施例的流程示本文档来自技高网...
基于深度学习的欺诈交易识别方法、系统及存储介质

【技术保护点】
1.一种基于深度学习的欺诈交易识别方法,其特征在于,所述方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练,并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

【技术特征摘要】
1.一种基于深度学习的欺诈交易识别方法,其特征在于,所述方法包括:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机RBM神经网络结构并进行训练,并通过训练完成的RBM神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。2.如权利要求1所述的基于深度学习的欺诈交易识别方法,其特征在于,所述构建堆叠的RBM神经网络结构并进行训练的步骤包括:设置所述堆叠的RBM神经网络结构的层数和每一层RBM神经网络的输出节点数;逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数;将训练完成的各层RBM神经网络进行堆叠。3.如权利要求2所述的基于深度学习的欺诈交易识别方法,其特征在于,所述逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数的步骤包括:确定所述训练样本的特征,并根据所述特征构建高维特征向量,由所述高维特征向量构成高维特征空间;基于所述高维特征空间,逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数。4.如权利要求3所述的基于深度学习的欺诈交易识别方法,其特征在于,所述基于所述高维特征空间,逐一训练所述每一层RBM神经网络,以确定各层RBM神经网络的参数的步骤包括:利用正态分布随机产生第一层RBM神经网络的参数初始值;利用所述高维特征空间的维度作为第一层RBM神经网络的输入节点数训练第一层RBM神经网络,训练时通过调整所述第一层RBM神经网络的参数初始值,得到第一层RBM神经网络的参数;在得到第N-1层RBM神经网络的参数后,利用正态分布随机产生第N层RBM神经网络的参数初始值;利用第N-1层RBM神经网络的输出节点数作为第N层RBM神经网络的输入节点数训练第N层神经网络,训练时通过调整所述第N层RBM神经网络的参数初始值,得到第N层RBM神经网络的参数,以得到各层RBM神经网络的参数,其中,N≥2。5.如权利要求2至4中任一项所述的基于深度学习的欺诈交易识别方法,其特征在于,所述每一层RBM神经网络包括可见层和隐藏层,所述每一层RBM神经网络的参数包括所述可见层和隐藏层之间的权重矩阵、可见层中可见节点的偏移量和隐藏层中隐藏节点的偏移量。6.如权利要求1所述的基于深度学习的欺诈交易识别方法...

【专利技术属性】
技术研发人员:许泰清盛帅张文慧曾征曾卓然
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1