面向交易欺诈检测的深度特征提取方法技术

技术编号：36765371 阅读：28 留言：0更新日期：2023-03-08 21:19

本发明专利技术公开了一种面向交易欺诈检测的深度特征提取方法。本发明专利技术针对各类样本在空间中重叠情况严重的问题，本发明专利技术在分类之间引入一个深度特征提取模型，考虑将原始的重叠度高的特征映射到另一个特征空间中，在这个空间中各个类别样本不重叠，各子类也不重叠，并且类别间距离大于子类间距离；使用五元组采样和损失函数共同训练一个特征提取模型迫使提取出来的特征既保留了不同类的区别性特征，也尽量保持了各子类的独有特征。持了各子类的独有特征。持了各子类的独有特征。

全部详细技术资料下载

【技术实现步骤摘要】
面向交易欺诈检测的深度特征提取方法

[0001]本专利技术涉及深度学习中表示学习领域，特别涉及一种面向交易欺诈检测的深度特征提取方法。

技术介绍

[0002]金融科技正推动电子交易支付的快速发展，与此同时信用卡交易欺诈的现象也日渐增多，这给运营商和金融机构带来的巨大的挑战。在信用卡欺诈交易检测的任务中，我们通常使用基于专家分析的方法或者数据分析方法来设计检测系统。专家分析通过制定规则来找出欺诈交易，该做法主观性强，可解释性差。数据分析方法是指利用机器学习相关算法识别异常交易，如支持向量机、逻辑回归、GBDT等。
[0003]传统的机器学习模型均基于一个基本假设：各个类别样本数量相差不大。然而在信用卡欺诈交易检测的任务中，我们可以获得的欺诈交易和正常交易的样本数量严重失衡，通常欺诈交易的数量十分稀少，该情况下如果使用传统的机器学习模型进行分类，模型将偏向于将异常样本识别成正常样本，这种结果并不会对模型的总体准确度产生太大影响，但这个模型为无效模型，因为我们建模的目的是想让其将异常样本检测出来。针对这个不平衡的问题，已经...

【技术保护点】

【技术特征摘要】
1.面向交易欺诈检测的深度特征提取方法，其特征在于，引入一个深度特征提取模型，该模型可以提取出使类间和类内都有区分性的特征；为了使得深度特征提取模型可以学到保持类间差异性和类内差异性的特征，由此提出五元组采样和损失函数；特征提取模型采用一个多层感知机，这里仅列举一个4层网络，输入层神经元个数由原始特征决定，输出层神经元个数由我们最终所需提取到的特征数确定，隐藏层的层数和每层神经元的个数需要根据具体情况确定；下面介绍五元组采样和损失函数；五元组采样：在采样之前我们先通过在一些先验特征上使用聚类算法来获得各个类别样本的子类，我们一般考虑使用基于密度的聚类算法，我们认为异常的样本(少类样本)的异常可能是由多种原因导致的，在空间中距离近的一些异常样本点是由同一种原因导致；聚类之后，我们从样本集里面随机取一个异常样本点S
i
，然后按照以下规则取出一组样本点作为五元组，然后按照以下规则取出一组样本点作为五元组S
i
，的定义如下：S
i
：第i个被采样的少数类样本离S
i
距离最近的多数类样本S
i
的同类同簇的样本中与S
i
距离最远的少数类样本S
i
的同类不同簇的样本中与S
i
距离最近的少数类样本S
i
的同类不同簇的样本中与S
i
距离最远的少数类样本根据我们的以上定义，在原始的特征空间中我们有如下距离关系成立：其中表示的是点S
i
和点S
j
之间的欧氏距离；在空间中各点距离满足式(1)合乎情理，因此我们考虑将样本点映射到新的特征空间中时，任然需要...

【专利技术属性】
技术研发人员：何莎，徐小龙，邬晶，李少远，周松，
申请(专利权)人：天翼电子商务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人