风控模型优化方法、终端及计算机可读存储介质技术

技术编号:18446213 阅读:11 留言:0更新日期:2018-07-14 10:54
本发明专利技术实施例公开了一种风控模型优化方法、终端及计算机可读存储介质,其中方法包括:获取多维度数据;对多维度数据进行处理,以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子;利用XGBoost算法,对第一风控特征因子、第二风控特征因子以及第三风控特征因子进行筛选及生成处理,以得到最有效风控特征因子和组合风控特征因子;将最有效风控特征因子和组合风控特征因子输入预设的风控模型,以预测用户逾期概率值。实施本发明专利技术实施例,基于多维度数据实现了风控模型优化,进一步地,基于优化后的风控模型,可以提高贷前审核、贷中监控过程中对用户进行识别的准确性。

Wind control model optimization method, terminal and computer readable storage medium

An embodiment of the invention discloses a wind control model optimization method, a terminal and a computer readable storage medium. The method includes: obtaining multidimensional data and processing multidimensional data to obtain first wind control characteristic factor, second wind control characteristic factor, and third wind control characteristic factor; the XGBoost algorithm is used to make use of the first wind control feature factor and the third wind control characteristic factor. One wind control characteristic factor, second wind control characteristic factor and the third wind control characteristic factor are screened and generated to get the most effective wind control characteristic factor and combination wind control characteristic factor, and the wind control model of the most effective wind control characteristic factor and combined wind control characteristic factor is input to predict the user's overdue probability value. According to the implementation of the invention, the wind control model is optimized based on the multi-dimensional data. Further, based on the optimized wind control model, the accuracy of the user identification in the pre loan audit and the monitoring process can be improved.

【技术实现步骤摘要】
风控模型优化方法、终端及计算机可读存储介质
本专利技术涉及互联网金融风控
,具体涉及一种风控模型优化方法、终端及计算机可读存储介质。
技术介绍
现阶段,互联网金融贷款服务公司,在提供放贷服务过程中,往往只有用户提交申请所填写的数据,以及人行征信数据可用,本身存在数据覆盖少,可用信息少等问题,难以支撑一个用户在贷前审核、贷中监控等关键环节的审查。
技术实现思路
本专利技术实施例的目的在于提供一种风控模型优化方法、终端及计算机可读存储介质,以基于多维度数据进行风控模型优化,提高贷前审核、贷中监控过程中对用户进行识别的准确性。为实现上述目的,第一方面,本专利技术实施例提供了一种风控模型优化方法,包括:获取多维度数据,所述多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置轨迹数据以及用户设备基础信息数据;对所述多维度数据进行处理,以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子;利用XGBoost算法,对所述第一风控特征因子、第二风控特征因子以及第三风控特征因子进行筛选及生成处理,以得到最有效风控特征因子和组合风控特征因子;将所述最有效风控特征因子和组合风控特征因子输入预设的风控模型,以预测用户逾期概率值。作为本申请一种优选的实施方式,对所述多维度数据进行处理,以得到第一风控特征因子具体包括:利用NaiveBayes算法对所述应用类别数据进行分类,以得到多个应用类别;根据所述应用类别,结合所述用户使用行为数据,利用LR算法计算出每一用户对每一类使用行为的的行为偏好;将所述行为偏好作为所述第一风控特征因子。作为本申请一种优选的实施方式,对所述多维度数据进行处理,以得到第二风控特征因子具体包括:利用GeoHash技术,结合所述用户设备地理位置轨迹数据,计算算用户设备任一时间段所处地点的地理类型;将所述地理类型作为所述第二风控特征因子。作为本申请一种优选的实施方式,所述用户设备基础信息数据包括国际移动设备身份码、MAC地址及国际移动用户识别码,对所述多维度数据进行处理,以得到第三风控特征因子具体包括:利用图算法,结合所述用户设备基础信息数据获取多个用户设备的关联数据;将所述关联数据作为所述第三风控特征因子。作为本申请一种优选的实施方式,所述优化方法还包括:根据所述用户逾期概率值和预设的测试样本集中用户的好坏标识得到ks指标值。第二方面,本专利技术实施例提供了一种风控模型优化终端,包括:获取单元,用于获取多维度数据,所述多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置轨迹数据以及用户设备基础信息数据;第一处理单元,用于对所述多维度数据进行处理,以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子;第二处理单元,用于利用XGBoost算法,对所述第一风控特征因子、第二风控特征因子以及第三风控特征因子进行筛选及生成处理,以得到最有效风控特征因子和组合风控特征因子;优化单元,用于将所述最有效风控特征因子和组合风控特征因子输入预设的风控模型,以预测用户逾期概率值。作为本申请一种优选的实施方式,所述第一处理单元具体用于:利用NaiveBayes算法对所述应用类别数据进行分类,以得到多个应用类别;根据所述应用类别,结合所述用户使用行为数据,利用LR算法计算出每一用户对每一类使用行为的的行为偏好;将所述行为偏好作为所述第一风控特征因子;利用GeoHash技术,结合所述用户设备地理位置轨迹数据,计算算用户设备任一时间段所处地点的地理类型;将所述地理类型作为所述第二风控特征因子;利用图算法,结合所述用户设备基础信息数据获取多个用户设备的关联数据,所述用户设备基础信息数据包括国际移动设备身份码、MAC地址及国际移动用户识别码;将所述关联数据作为所述第三风控特征因子。作为本申请一种优选的实施方式,所述优化终端还包括:计算单元,用于根据所述用户逾期概率值和预设的测试样本集中用户的好坏标识得到ks指标值。第三方面,本专利技术实施例还提供了一种风控模型优化终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面所述的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面所述的方法。实施本专利技术实施例,先获取多维度数据进行处理以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子,再根据上述因子得到最有效风控特征因子和组合风控特征因子,最后将最有效风控特征因子和组合风控特征因子输入风控模型,以实现风控模型的优化;即本专利技术实施例基于多维度数据实现了风控模型优化,进一步地,基于优化后的风控模型,可以提高贷前审核、贷中监控过程中对用户进行识别的准确性。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。图1是本专利技术第一实施例提供的风控模型优化方法的示意流程图;图2是本专利技术第二实施例提供的风控模型优化方法的示意流程图;图3是本专利技术第一实施例提供的风控模型优化终端的结构示意图;图4是本专利技术第二实施例提供的风控模型优化终端的结构示意图;图5是本专利技术第三实施例提供的风控模型优化终端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。请参考图1,是本专利技术第一实施例所提供的风控模型优化方法的流程示意图,如图所示,该方法可以包括如下步骤:S101,获取多维度数据。其中,多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置轨迹数据以本文档来自技高网...

【技术保护点】
1.一种风控模型优化方法,其特征在于,包括:获取多维度数据,所述多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置轨迹数据以及用户设备基础信息数据;对所述多维度数据进行处理,以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子;利用XGBoost算法,对所述第一风控特征因子、第二风控特征因子以及第三风控特征因子进行筛选及生成处理,以得到最有效风控特征因子和组合风控特征因子;将所述最有效风控特征因子和组合风控特征因子输入预设的风控模型,以预测用户逾期概率值。

【技术特征摘要】
1.一种风控模型优化方法,其特征在于,包括:获取多维度数据,所述多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置轨迹数据以及用户设备基础信息数据;对所述多维度数据进行处理,以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子;利用XGBoost算法,对所述第一风控特征因子、第二风控特征因子以及第三风控特征因子进行筛选及生成处理,以得到最有效风控特征因子和组合风控特征因子;将所述最有效风控特征因子和组合风控特征因子输入预设的风控模型,以预测用户逾期概率值。2.如权利要求1所述的风控模型优化方法,其特征在于,对所述多维度数据进行处理,以得到第一风控特征因子具体包括:利用NaiveBayes算法对所述应用类别数据进行分类,以得到多个应用类别;根据所述应用类别,结合所述用户使用行为数据,利用LR算法计算出每一用户对每一类使用行为的的行为偏好;将所述行为偏好作为所述第一风控特征因子。3.如权利要求2所述的风控模型优化方法,其特征在于,对所述多维度数据进行处理,以得到第二风控特征因子具体包括:利用GeoHash技术,结合所述用户设备地理位置轨迹数据,计算算用户设备任一时间段所处地点的地理类型;将所述地理类型作为所述第二风控特征因子。4.如权利要求3所述的风控模型优化方法,其特征在于,所述用户设备基础信息数据包括国际移动设备身份码、MAC地址及国际移动用户识别码,对所述多维度数据进行处理,以得到第三风控特征因子具体包括:利用图算法,结合所述用户设备基础信息数据获取多个用户设备的关联数据;将所述关联数据作为所述第三风控特征因子。5.如权利要求4所述的风控模型优化方法,其特征在于,所述优化方法还包括:根据所述用户逾期概率值和预设的测试样本集中用户的好坏标识得到ks指标值。6.一种风控模型优化终端,其特征在于,包括:获取单元,用于获取多维度数据,所述多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置...

【专利技术属性】
技术研发人员:周南潘丽妃曾理李孚煜罗伟东
申请(专利权)人:深圳市和讯华谷信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1