The invention discloses a transaction data based machine learning fraud monitoring system, including management platform, ETL module, sampling engine, stream processing engine, engine, engine and training prediction decision engine; stream processing engine flow through large data processing and rapid extraction and calculation of large transactions the original data for the feature. From the mass of the original data are representative characteristics, to extract information in data. The integrated framework of machine learning model and learning model using a variety of training modules for the funds, the loss rate of the black sample recall was optimized, a optimization model for composite index, to overcome the overfitting and unstable defects brought by a single model, improves the stability and generalization ability of the model; model through training module update time preset, automatic access to the latest data and re training model, so that the model remains valid, avoid fraud variation due to the problem of model failure.
【技术实现步骤摘要】
一种基于交易数据的机器学习反欺诈监测系统
本专利技术涉及金融领域,尤其是指一种基于交易数据的机器学习反欺诈监测系统。
技术介绍
互联网技术的蓬勃发展造就了新一轮的金融革命,但过快的增长也蕴藏着极大的盲目性,相伴而生的是日趋严重的欺诈风险。目前较为常见的欺诈监测模式包括基于大数据的风险政策、反欺诈体系以及精英风控团队等。虽然大多数支付机构都有欺诈监测系统,但多数仍依赖于精英团队在案例分析的基础上进行规则归纳。然而,欺诈手段层出不穷和交易行为的不一致给规则归纳带来了困难。同时,当前规则系统难以保持其鲁棒性,性能也将随着规则体系的扩大而下降,无法保证高查准率的同时有高查全率,从而降低用户体验。机器学习由于其在非线性与代价敏感场景的优势,同时又较少依赖于人工分析,表现出了更优的鲁棒性与稳定性,所以逐渐成为一种新的欺诈检测方案。
技术实现思路
本专利技术的目的在于针对现有技术存在的问题,提供一套面向金融领域的交易欺诈实时监测系统。通过对清洗后的历史交易数据进行分析和建模,在新交易发生时,将当前交易行为与历史交易行为进行比较,根据输出的评分对该笔交易风险进行实时判断,从而达到实时交易欺诈检测的目标。该系统可以在较低误报率情况下,达到较高的精准度和查全率,从而保证客户的交易安全。本专利技术的目的是通过以下技术方案来实现的:一种基于交易数据的机器学习反欺诈监测系统,该系统包括管理平台、ETL模块、采样引擎、流处理引擎、训练引擎、预测引擎和决策引擎;所述管理平台提供每个模块的配置信息,并发起模型训练请求和预测请求,对模型进行管理和更新操作;所述配置信息包括ETL模块所需的数据时 ...
【技术保护点】
一种基于交易数据的机器学习反欺诈监测系统,其特征在于,该系统包括管理平台、ETL模块、采样引擎、流处理引擎、训练引擎、预测引擎和决策引擎;所述管理平台提供每个模块的配置信息,并发起模型训练请求和预测请求,对模型进行管理和更新操作;所述配置信息包括ETL模块所需的数据时间区间,采样引擎所需的数据库字段,流处理引擎所需的特征名称和计算方式,训练引擎所需的算法名称和算法参数。所述ETL模块根据管理平台的配置信息,提取原始数据库数据,进行数据抽取、转换、入库操作;所述数据转换操作主要对数据进行清洗和标准化,包括两部分:将原始数据库自定义的数据转化为标准数据;将机器学习模型无法处理的字段进行转化;数据入库操作将处理完毕的数据存入任意常用数据库。所述采样引擎根据管理平台的配置信息对原始数据进行采样,从原始数据中提取流处理引擎需要的数据库字段。所述流处理引擎根据管理平台配置的特征名称和计算方式,对采样数据进行特征提取和计算。所述训练引擎包括数据清洗、模型训练、模型评估;所述数据清洗,对数据进行缺失值处理、归一化处理等标准数据清洗操作;所述模型训练,根据设定的模型参数,利用清洗后的特征数据进行训练,具 ...
【技术特征摘要】
1.一种基于交易数据的机器学习反欺诈监测系统,其特征在于,该系统包括管理平台、ETL模块、采样引擎、流处理引擎、训练引擎、预测引擎和决策引擎;所述管理平台提供每个模块的配置信息,并发起模型训练请求和预测请求,对模型进行管理和更新操作;所述配置信息包括ETL模块所需的数据时间区间,采样引擎所需的数据库字段,流处理引擎所需的特征名称和计算方式,训练引擎所需的算法名称和算法参数。所述ETL模块根据管理平台的配置信息,提取原始数据库数据,进行数据抽取、转换、入库操作;所述数据转换操作主要对数据进行清洗和标准化,包括两部分:将原始数据库自定义的数据转化为标准数据;将机器学习模型无法处理的字段进行转化;数据入库操作将处理完毕的数据存入任意常用数据库。所述采样引擎根据管理平台的配置信息对原始数据进行采样,从原始数据中提取流处理引擎需要的数据库字段。所述流处理引擎根据管理平台配置的特征名称和计算方式,对采样数据进行特征提取和计算。所述训练引擎包括数据清洗、模型训练、模型评估;所述数据清洗,对数据进行缺失值处理、归一化处理等标准数据清洗操作;所述模型训练,根据设定的模型参数,利用清洗后的特征数据进行训练,具体为:读取管理平台配置的算法名称和算法参数,调用常见的机器学习算法,包括有监督算法和无监督算法进行学习;有监督算法包括逻辑回归、线性回归、支持向量机、决策树算法等;无监督算法包括k‐means聚类等;所述模型评估,利用新的数据集对训练好的模型进行评价,根据输出的查全率、查准率,KS值,ROC曲线等指标对模型质量进行评价,如果质量...
【专利技术属性】
技术研发人员:孙斌杰,黄滔,王新根,高杨,李云领,唐迪佳,乔阳,
申请(专利权)人:浙江邦盛科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。