【技术实现步骤摘要】
一种基于不平衡流数据分类的信用卡欺诈检测方法
本专利技术涉及一种基于不平衡流数据分类的信用卡欺诈检测方法。
技术介绍
信用卡的广泛使用,在为商家和用户交易带来极大方便的同时,也面临大量的信用卡欺诈,我国金融机构每年因信用卡欺诈损失数十亿元。信用卡欺诈是当前大数据金融时代国家与社会特别是银行业面临的一个金融风险,如何实现信用卡流数据欺诈检测是金融机构需要解决的一个重要技术问题和社会问题,具有重大的金融价值和社会意义。在信用卡离线刷卡或在线购物应用背景下,产生了一种海量、实时、动态的数据形式,被称为信用卡流数据。信用卡流数据的动态变化称为概念漂移,是信用卡流数据最重要的特点之一,它描述着信用卡流数据分布随着环境而不断变化的过程。通常地,信用卡流数据分布的变化是不可事先预知的,这为信用卡动态流数据的分类提出了重大挑战。传统的信用卡流数据分类技术假定数据分布是稳定的,然而在信用卡动态数据流场景中,信用卡流数据分布在不断变化。信用卡真实应用场景中的流数据往往包含了多种类型的概念漂移,然而,目前已存在的信用卡流数据分类方 ...
【技术保护点】
1.一种基于不平衡流数据分类的信用卡欺诈检测方法,其特征在于:包括以下步骤:/n1)在当前时刻输入信用卡流数据块,该流数据块中某一类别样本即信用卡使用的一类数据的数量少于另一类别的数量,即每个信用卡流数据块中样本的类别分布是不平衡的;/n2)把该信用卡流数据块中的样本划分成两部分,即信用卡流数据训练块和信用卡流数据测试块,其中的信用卡流数据训练块作为训练集用于训练新的基础分类器,信用卡流数据测试块作为测试集用于评估检测方法的性能;/n3)在当前的信用卡流数据训练块中,基于袋装算法获取若干类别分布平衡的子块,用于训练候选分类器;每个子块中包含了当前信用卡流数据训练块中的小样本 ...
【技术特征摘要】
1.一种基于不平衡流数据分类的信用卡欺诈检测方法,其特征在于:包括以下步骤:
1)在当前时刻输入信用卡流数据块,该流数据块中某一类别样本即信用卡使用的一类数据的数量少于另一类别的数量,即每个信用卡流数据块中样本的类别分布是不平衡的;
2)把该信用卡流数据块中的样本划分成两部分,即信用卡流数据训练块和信用卡流数据测试块,其中的信用卡流数据训练块作为训练集用于训练新的基础分类器,信用卡流数据测试块作为测试集用于评估检测方法的性能;
3)在当前的信用卡流数据训练块中,基于袋装算法获取若干类别分布平衡的子块,用于训练候选分类器;每个子块中包含了当前信用卡流数据训练块中的小样本以及一部分随机采样的大样本,并且随机采样大样本的数量取决于当前的信用卡流数据训练块中小样本的总量;
4)每个信用卡流数据子块训练得到一个基础分类器,每个基础分类器中的信用卡流数据训练块样本的类别分布是平衡的;
5)计算最新信用卡流数据训练块中样本的权重,其中易分错的信用卡流数据样本被赋予较高的更新权重;
6)使用最新的信用卡流数据块中样本更新分类模型中先前的基础分类器;
7)计算每个基础分类器的权重,去除分类模型中权重最小的基础分类器;同时去除性能较差的基础分类器,使得分类模型较快地适应新的信用卡流数据检测环境;
8)基于信用卡流数据基础分类器的权重,综合分类模型中所有基础分类器的性能,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。