一种深度学习与传统机器学习结合的集成学习方法技术

技术编号:41730645 阅读:24 留言:0更新日期:2024-06-19 12:52
一种深度学习与传统机器学习结合的集成学习方法,包括如下流程,S1:特征处理计算,具;S2:通过步骤S1生成的特征对多种模型进行训练;S3:模型筛选;S4:将训练及筛选完成后的模型对同一笔交易进行预测计算;S5:投票计算;S6:解释计算;S7:步骤S1‑S6获得的数据协同用于现有金融交易防欺诈应用软件。本发明专利技术能控制打扰率;能通过对投票中是否投票正确进行统计记录,来对集成学习中的子模型进行遴选与更新换代;有效解决了现有深度学习模型难以应用于现有防欺诈软件真实风控系统的难题,即补充了它们可解释性方面的缺失,且本发明专利技术集成学习架构有利于在实际业务中进行分布式架构,减少对单硬件的性能需求,有效降低了风控成本。

【技术实现步骤摘要】

本专利技术涉及金融业交易欺诈检测,特别是一种深度学习与传统机器学习结合的集成学习方法


技术介绍

1、随着互联网技术应用于金融业领域越来越深入,也对互联网金融技术提出了越来越高的安全要求,比如说金融交易中,防止信用卡欺诈是保证持卡方及管理方(信用卡支持方)利益的核心基础。现有互联网技术中,对于防止金融交易欺诈的检测软件,一般会应用到基于机器学习的欺诈检测模型和基于深度学习的欺诈检测模型,结合其他软件单元对金融交易中存在的交易欺诈行为进行识别判断。

2、目前,基于机器学习的欺诈检测模型涉及到的技术方案包括如下。(1)boosting(提升方法):具体的,从初始训练集训练一个基学习器,在基于基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个基学习器;如此重复进行直至基学习器数目达到指定t值,最终进行加权结合得到结果。(2)bagging(引导聚集算法):基于自主采样法,从整体数据集中进行有放回抽样、得到n个数据集,并在每个数据集上学习出一个模型,最后预测结果利用n个模型投票的本文档来自技高网...

【技术保护点】

1.一种深度学习与传统机器学习结合的集成学习方法,其特征在于,包括如下流程,S1:特征处理计算,具体的,针对现有机器学习中的单笔交易信息量不足的问题、通过时序特征生成算法及其他时序特征算法进行处理,时序特征生成算法中,首先提取时间段T内所有属于同一用户的金融交易数据,然后针对每笔交易在一定时间内的特征变动幅度进行数值化衡量建立交叉熵,其他时序特征计算的数据包括时间段内的总交易量、总交易金额、平均交易金额、该笔交易相对于平均交易的偏差;S2:通过步骤S1生成的特征对多种模型进行训练,具体模型包括在欺诈检测任务中应用的深度学习模型以及可解释性好的机器学习模型,训练通过分布式架构方式进行,加快...

【技术特征摘要】

1.一种深度学习与传统机器学习结合的集成学习方法,其特征在于,包括如下流程,s1:特征处理计算,具体的,针对现有机器学习中的单笔交易信息量不足的问题、通过时序特征生成算法及其他时序特征算法进行处理,时序特征生成算法中,首先提取时间段t内所有属于同一用户的金融交易数据,然后针对每笔交易在一定时间内的特征变动幅度进行数值化衡量建立交叉熵,其他时序特征计算的数据包括时间段内的总交易量、总交易金额、平均交易金额、该笔交易相对于平均交易的偏差;s2:通过步骤s1生成的特征对多种模型进行训练,具体模型包括在欺诈检测任务中应用的深度学习模型以及可解释性好的机器学习模型,训练通过分布式架构方式进行,加快模型训练速度,同时考虑到深度学习训练时的随机性,同一深度学习模型进行k次训练得到k个子模型用以进行后续预测,对应的,考虑到各模型在投票阶段中的权重一致性,传统机器学习模型用同样方式得到k个子模型;s3:模型筛选,具体的,使用事先准备好的深度学习与传统机器学习测试集,对步骤s2中各模型进行测试,若模型准确率达到指定阈值,则进入下一流程,否则为不达标模型,不进入下一流程的预测及投票;s4:将训练及筛选完成后的模型对同一笔交易进行预测计算,得到一个长度为n的01向量,其中第i个元素为0/1表示第i个模型对该笔交易的预测为正常/欺诈交易,公式为x=[res0,res1,...,resn];s5:投票计算,具体的,将步骤s4获得的数据01向量...

【专利技术属性】
技术研发人员:王龙逊田华明谢立韩莉程大伟
申请(专利权)人:上海帆立信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1