一种基于多目标优化的风控模型构建方法、装置和电子设备制造方法及图纸

技术编号：29940096 阅读：53 留言：0更新日期：2021-09-04 19:23

本发明专利技术涉及计算机技术领域，具体涉及一种基于多目标优化的风控模型构建方法、装置和电子设备，包括：获取业务样本数据集，对所述业务样本数据集中的每一个样本对应的特征组设定多个相应的标签；根据所述标签对所述业务样本数据集进行预处理，得到业务样本训练集；构建初始风控模型，所述初始风控模型内部包含多个级联的逻辑回归算法；根据所述业务样本训练集对所述初始风控模型进行多目标联合训练，得到最终风控模型。本发明专利技术在保障了模型可解释性的情况下，仍可以获得优秀的模型指标和业务效果，由于使用了多目标优化联合训练，大幅缓解了样本偏差问题，使得构建出来的风控模型在实际上线后，效果优良，表现稳定，泛化能力强。泛化能力强。泛化能力强。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多目标优化的风控模型构建方法、装置和电子设备

[0001]本专利技术涉及计算机
，尤其涉及一种基于多目标优化的风控模型构建方法、装置和电子设备。

技术介绍

[0002]对于互联网线上消费贷的风控系统，目前业界的一般主流做法是使用人工策略和机器学习模型的相结合的方式构建而成。对于人工策略来说，由于策略规则一般相对简单，容易被黑色产业链和反欺诈团队通过多次试错和碰撞来攻破。对于机器学习风控模型来说，业界目前主流的采用基于逻辑回归算法(Logistic Regression)、基于决策树类算法、基于深度学习三类算法来构建模型。
[0003]基于逻辑回归算法构建出来的风控模型，其优点主要是模型可解释性强，归因分析方便。鉴于传统金融机构内审内控部门和国家监管机构对风控模型的可解释性有一定要求，所以逻辑回归算法依然是构建风控模型的首选。但此类模型的缺点也很明显，它的模型指标在所有机器学习算法中往往是最低的，业务效果一般。
[0004]基于决策树类的模型算法目前广泛应用于互联网线上消费贷款的风控模型之中。其中比较有代表性的算法有：随机森林，GBDT，xgBoost，lightGBM等。此类算法的模型指标要比传统的逻辑回归高很多，业务效果较好。但是决策树类算法的模型结构非常复杂，很难理出一个清晰又符合业务逻辑的模型解释。对模型未来在线上的表现，缺乏有效性和稳定性的背书。模型可解释性差。这一点往往成为国家监管机构问询的主要问题。
[0005]基于深度学习的风控模型往往使用在行为风险评估的B卡模型里...

【技术保护点】

【技术特征摘要】
1.一种基于多目标优化的风控模型构建方法，其特征在于，包括：获取业务样本数据集，对所述业务样本数据集中的每一个样本对应的特征组设定多个相应的标签；根据所述标签对所述业务样本数据集进行预处理，得到业务样本训练集；构建初始风控模型，所述初始风控模型内部包含多个级联的逻辑回归算法；根据所述业务样本训练集对所述初始风控模型进行多目标联合训练，得到最终风控模型。2.如权利要求1所述的一种基于多目标优化的风控模型构建方法，其特征在于，所述获取业务样本数据集，包括：基于原始的用户画像数据提取业务样本数据集。3.如权利要求1所述的一种基于多目标优化的风控模型构建方法，其特征在于，所述对所述业务样本数据集中的每一个样本对应的特征组设定多个相应的标签，包括：根据业务逻辑确定用户的区分标准；根据所述用户的区分标准制定所述业务样本数据集中的标签设定规则；基于标签设定规则对所述业务样本数据集中的每一个样本对应的特征组设定多个相应的标签。4.如权利要求1所述的一种基于多目标优化的风控模型构建方法，其特征在于，所述根据所述标签对所述业务样本数据集进行预处理，包括：根据所述业务样本数据集与所述标签的相关联对所述业务样本数据集进行筛选；对筛选后的所述业务样本数据集进行特征清洗；对清洗后的所述业务样本数据集进行特征加工、特征编码。5.如权利要求4所述的一种基于多目标优化的风控模型构建方法，其特征在于，所述对清洗后的所述业务样本数据集进行特征加工、特征编码，包括：对所述业务样本数据集进行缺失值填充；对所述业务样本数据集进行特征衍生和特征组合；对所述业务样本数据集中离散特征进行转化；对所述业务样本数据集进行离散化处理。6.如权利要求1所述的一种基于多目...

【专利技术属性】
技术研发人员：傅迪勇，杨海天，李朦，
申请(专利权)人：上海华瑞银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人