一种信用卡盗刷事件预警模型的建立及评估方法技术

技术编号:23345102 阅读:40 留言:0更新日期:2020-02-15 04:27
本发明专利技术涉及一种信用卡盗刷事件预警模型的建立及评估方法,属于金融数据挖掘分析预测领域。本发明专利技术先建立一个持卡者交易数据库,将持卡者交易编号作为标识符ID,对应记录作为一个样本T,所有样本集合为D;对样例数据集进行数据预处理及采用随机森林进行特征选择,得到Dataset1;将Dataset1先划分为训练集和测试集;再对训练集进行划分,多类数据集为D1;少类数据集为D2;采用改进重采样对数据集D2进行扩充及数据集D1进行减少,并将重采样后训练集train data set1送入ELM模型进行训练分类,最终在测试集上输出预警结果。本发明专利技术提供了改进重采样组合ELM对信用卡盗刷事件进行预警,应用到信用卡盗刷事件数据集上有一定的参考价值。

An early warning model of credit card theft and its evaluation method

【技术实现步骤摘要】
一种信用卡盗刷事件预警模型的建立及评估方法
本专利技术涉及一种信用卡盗刷事件预警模型的建立及评估方法,属于金融数据挖掘分析预测领域。
技术介绍
生活中,刷卡消费也已经成为了人们购物消费的的主要方式。但人们在平常使用信用卡时有时会发生信用卡盗刷的现象。信用卡盗刷就是别人盗取了你的信用卡或是盗取了你的信用卡信息从而通过你的信用卡进行交易,该情况不仅会造成持卡人经济损失还会对持卡者信用造成恶劣影响。
技术实现思路
本专利技术要解决的技术问题是提供一种信用卡盗刷事件预警模型的建立及评估方法,可作为辅助参考,帮助证明持卡者是否存在盗刷风险、挽救持卡者的经济和信用。本专利技术采用的技术方案是:一种信用卡盗刷事件预警模型的建立及评估方法,包括如下步骤:1)建立数据库:根据持卡者交易数据信息,建立一个持卡者消费记录的数据库,每条消费记录的编号作为标识符ID,每一行的对应记录作为一个样本T,每个样本T包含该条消费记录的基本信息,每一列为交易属性值集合SZset,所有样本集合为D;2)数据清洗及特征选择:对数据库中所有数本文档来自技高网...

【技术保护点】
1.一种信用卡盗刷事件预警模型的建立及评估方法,其特征在于:包括如下步骤:/n1)建立数据库:根据持卡者交易数据信息,建立一个持卡者消费记录的数据库,每条消费记录的编号作为标识符ID,每一行的对应记录作为一个样本T,每个样本T包含该条消费记录的基本信息,每一列为交易属性值集合SZset,所有样本集合为D;/n2)数据清洗及特征选择:对数据库中所有数据进行清洗、挖掘及填充后得到完整数据集DataSet,该数据集有N条样例,M个特征,采用随机森林算法对数据集DataSet进行重要性排序,取其最重要的5个特征,形成精准数据集DataSet1;/n3)数据划分:对精准数据集DataSet1进行划分,先...

【技术特征摘要】
1.一种信用卡盗刷事件预警模型的建立及评估方法,其特征在于:包括如下步骤:
1)建立数据库:根据持卡者交易数据信息,建立一个持卡者消费记录的数据库,每条消费记录的编号作为标识符ID,每一行的对应记录作为一个样本T,每个样本T包含该条消费记录的基本信息,每一列为交易属性值集合SZset,所有样本集合为D;
2)数据清洗及特征选择:对数据库中所有数据进行清洗、挖掘及填充后得到完整数据集DataSet,该数据集有N条样例,M个特征,采用随机森林算法对数据集DataSet进行重要性排序,取其最重要的5个特征,形成精准数据集DataSet1;
3)数据划分:对精准数据集DataSet1进行划分,先划分训练集traindataset和测试集testdataset;对训练集traindataset再进行多类数据集D1和少类数据集D2的划分;
4)重采样及测试集分类:对D1和D2进行重采样处理,使得D1、D2数据量相对平衡,得到重采样后训练集traindataset1;把重采样后训练集traindataset1送入ELM模型进行训练,然后通过训练后的ELM模型对测试集testdataset进行分类;
5)模型评估:对测试集testdataset得到的分类结果,生成一个持卡者消费记录的混淆矩阵Conf_M...

【专利技术属性】
技术研发人员:宋耀莲徐文林田曙光彭宇
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1