The invention provides an online and offline hybrid wind control modeling training and production publishing method and system. The online and offline hybrid wind control modeling training and production publishing system comprises a decision service module, a scoring calculation module and a feature calculation module. The decision service module is used to receive computing requests sent by an external system, and to calculate the scoring module and the features. The computing module provides a unified call interface for interacting with the external system; the feature computing module is used for feature management, configuration feature computing logic, computing process and data source; and the scoring calculation module is used for configuration of computing model and feature parameters, scoring and testing the request parameters in the calculation request input by the external system. The invention can ensure that the data environment under the model training line is consistent with the data environment on the line, and the code under the model line is consistent with the code of the production environment on the line, so as to ensure that the effect of the scoring model is not distorted and landed in the production environment.
【技术实现步骤摘要】
线上线下混合的风控建模训练和生产发布方法及系统
本专利技术涉及金融产品模型
,具体为一种线上线下混合的风控建模训练和生产发布方法及系统。
技术介绍
目前常见的评分模型的落地过程可以粗略划分为线下建模训练和线上生产发布两个步骤。第一步:数据建模人员以多样的数据仓库(离线非实时数据,遵循数仓标准架构,举比较常见的一种情况为例:较小规模结构化数据存储于MYSQL中,较大规模半结构化、非结构化数据存储于HIVE中)为数据源,根据自身经验和数据挖掘算法,运用建模工具(R、SAS、PYTHON以及一些界面化建模工具,取决于个人习惯),训练出在金融产品生命周期各阶段具有良好数据表现的评分。第二步:后台决策系统的程序员拿到建模需求后,编写特征代码,编写模型计算代码,进行单元测试保证不报错。第三步,模型人员验收计算逻辑和模型效果,完成后正式投产并持续监控模型表现。上述模型落地过程存在以下缺点:1、建模源数据来自数据仓库(MYSQL\HIVE)中的贴源层表、中间层处理过的表,这些数据与生产环境有结构差别(分表并表、数仓解析丢数、线上删数据等)或者在生产环境根本没有。2、由于数据 ...
【技术保护点】
1.一种线上线下混合的风控建模训练和生产发布系统,其特征在于,所述线上线下混合的风控建模训练和生产发布系统包括:决策服务模块,评分计算模块以及特征计算模块;所述决策服务模块用于接收外部系统发送的计算请求,为所述评分计算模块和所述特征计算模块提供与所述外部系统进行交互的统一调用接口;所述特征计算模块用于特征管理、配置特征计算逻辑、计算流程以及数据源;所述评分计算模块用于配置计算模型和特征参数,对所述外部系统输入的所述计算请求中的请求参数进行评分和测试。
【技术特征摘要】
1.一种线上线下混合的风控建模训练和生产发布系统,其特征在于,所述线上线下混合的风控建模训练和生产发布系统包括:决策服务模块,评分计算模块以及特征计算模块;所述决策服务模块用于接收外部系统发送的计算请求,为所述评分计算模块和所述特征计算模块提供与所述外部系统进行交互的统一调用接口;所述特征计算模块用于特征管理、配置特征计算逻辑、计算流程以及数据源;所述评分计算模块用于配置计算模型和特征参数,对所述外部系统输入的所述计算请求中的请求参数进行评分和测试。2.根据权利要求1所述的线上线下混合的风控建模训练和生产发布系统,其特征在于,所述决策服务模块包括:接口调用单元,用于为所述评分计算模块和所述特征计算模块提供与所述外部系统进行交互的统一调用接口;计算异常处理单元,用于对计算超时、计算异常的特征进行标记和提醒。3.根据权利要求1所述的线上线下混合的风控建模训练和生产发布系统,其特征在于,所述特征计算模块包括:特征管理单元,用于配置特征标签描述和特征标签代码;逻辑管理单元,用于配置特征计算逻辑;流程配置单元,用于配置逻辑规则的计算流程;数据源配置单元,用于配置数据源及连接所述数据源的连接参数。4.根据权利要求4所述的线上线下混合的风控建模训练和生产发布系统,其特征在于,所述数据源包括:MYSQL、HBASE、NEO4J以及HTTP接口。5.根据权利要求5所述的线上线下混合的风控建模训练和生产发布系统,其特征在于,根据不同特征类型需要采用不同的数据同步机制:业务交易类型的数据采用MySQL数据库binlog的数据同步机制;爬虫抓取的通讯录、通话记录、设备信息及用户行为数据,采用基于消息队列机制驱...
【专利技术属性】
技术研发人员:何同国,卞晓月,李峰,李麟,俞临曲,张晓丽,张黛雯,昌黎,唐清文,王芳,
申请(专利权)人:上海前隆信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。