【技术实现步骤摘要】
风控模型训练方法、系统、设备及计算机可读介质
本专利技术属于风险控制
,涉及一种风险控制系统,尤其涉及一种风控模型训练方法、系统、设备及计算机可读介质。
技术介绍
风险控制是金融的关键,随着时代的发展,风控领域的一个总趋势是越来越信息化、模型化、智能化。通常构建风险模型时需要准备的样本数据量比较大,尤其是在使用当下较为流行的XGBoost、深度学习等算法时,这种对数据量要求会显得格外突出。同时,实务中业务变化很快,难以有足够多的时间去积累足够多的样本。有鉴于此,如今迫切需要设计一种新的风险控制方式,以便克服现有风险控制方式存在的上述至少部分缺陷。
技术实现思路
本专利技术提供一种风控模型训练方法、系统、设备及计算机可读介质,可提升模型的准确率及鲁棒性。为解决上述技术问题,根据本专利技术的一个方面,采用如下技术方案:一种风控模型训练方法,所述训练方法包括:步骤S1、第二场景的第二数据集和第二逾期标签作为训练集和训练集标签,第一场景的第一数据集及第一逾期标签作为测 ...
【技术保护点】
1.一种风控模型训练方法,其特征在于,所述训练方法包括:/n步骤S1、第二场景的第二数据集和第二逾期标签作为训练集和训练集标签,第一场景的第一数据集及第一逾期标签作为测试集和测试集逾期标签,第二场景没有但第一场景有的特征在训练的时候设置为统一的缺失值;以XGBoost算法训练源模型,得到模型A和模型A的树的颗数N;训练模型的过程包括:(1)特征筛选:根据特征的饱和度、特征分布的稳定性、训练标签的区分效果的稳定性、信息量指标,去除掉不佳的特征;(2)XGBoost算法参数调参:根据经验或历史数据对参数进行调参;/n步骤S2、基于模型A,将第一场景的第三数据集和第三逾期标签作为 ...
【技术特征摘要】
1.一种风控模型训练方法,其特征在于,所述训练方法包括:
步骤S1、第二场景的第二数据集和第二逾期标签作为训练集和训练集标签,第一场景的第一数据集及第一逾期标签作为测试集和测试集逾期标签,第二场景没有但第一场景有的特征在训练的时候设置为统一的缺失值;以XGBoost算法训练源模型,得到模型A和模型A的树的颗数N;训练模型的过程包括:(1)特征筛选:根据特征的饱和度、特征分布的稳定性、训练标签的区分效果的稳定性、信息量指标,去除掉不佳的特征;(2)XGBoost算法参数调参:根据经验或历史数据对参数进行调参;
步骤S2、基于模型A,将第一场景的第三数据集和第三逾期标签作为再次训练的训练集和训练集标签,在模型A的数据结构的基础上再次训练出N颗树,得到最终的增量学习模型。
2.一种风控模型训练方法,其特征在于,所述训练方法包括:
步骤S1、第二场景的第二数据集和第二逾期标签作为训练集和训练集标签,第一场景的第一数据集及第一逾期标签作为测试集和测试集逾期标签,第二场景没有但第一场景有的特征在训练的时候设置为统一的缺失值;训练源模型,得到模型A和模型A的树的颗数N;
步骤S2、基于模型A,将第一场景的第三数据集和第三逾期标签作为再次训练的训练集和训练集标签,在模型A的数据结构的基础上再次训练出M颗树,得到最终的增量学习模型;其中,M∈[0.9N,1.1N]。
3.根据权利要求2所述的风控模型训练方法,其特征在于:
所述步骤S1中,以XGBoost算法训练源模型,得到模型A和模型A的树的颗数N。
4.根据权利要求2所述的风控模型训练方法,其特征在于:
所述步骤S1中,训练模型的过程包括:
特征筛选:根据特征的饱和度、特征分布的稳定性、训练标签的区分效果的稳定性、信息量指标,去除掉不佳的特征;
XGBoost算法参数调参:根据经验或历史数据对参数进行调参。
5.一种风控模型训练系统,其特征在于,所述训练系统包括:
源模型训练模块,用以将第二场景的第二数据集和第二逾期标签作为训练集和训练集标签,第一场景的第一数据集及第一逾期标签作为测试集和测试集逾期标签,第二场景没有但第一场景有的特征在训练的时...
【专利技术属性】
技术研发人员:林建明,
申请(专利权)人:深圳无域科技技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。