【技术实现步骤摘要】
召回模型的生成方法及装置
本专利技术涉及信息处理
,特别是涉及一种召回模型的生成方法及装置。
技术介绍
随着经济的快速发展,信用消费也越来越受关注,信用卡消费、个人汽车贷款、助学贷款、小额消费贷款等各种个人消费贷款日益增多,且增长速度非常快。为了能够对个人的借贷风险进行有效评估,通常会将风险规则和风控模型相结合的方式对个人信息进行风险评估。在现有的风险评估系统中,模型的训练需要有效的数据。例如,数据的积累是否达到了一定的规模并且是可以做标注的,而且模型的性能依赖于特征的选择。以个人风险识别为例,在风险模型的建立过程中,需要得到用户的还款情况信息来作为标注信息的一部分,进而得到可以用于模型训练的样本数据,这就使得模型训练所用的样本都来源于那些通过风控系统的审核并且成交后有还款记录的订单数据。可见,在风控系统中的模型训练时利用的样本数据较为单一,使得经过风控系统审核后被拒绝的客户不一定是高风险或不可以接收的客户。从而使得风控系统的审核准确度下降,降低了有效客户的召回率,无法满足实际的应用需求。专利技 ...
【技术保护点】
1.一种召回模型的生成方法,其特征在于,所述方法包括:/n通过风控系统获得样本信息,所述风控系统表征对初始样本信息进行审核的系统,所述样本信息包括通过所述风控系统审核的样本和未通过所述风控系统审核且没有被交易系统利用的样本;/n在所述样本信息中进行筛选,得到训练样本;/n将所述训练样本信息输入机器学习模型,训练得到召回模型;/n对所述召回模型进行优化处理,得到目标召回模型。/n
【技术特征摘要】
1.一种召回模型的生成方法,其特征在于,所述方法包括:
通过风控系统获得样本信息,所述风控系统表征对初始样本信息进行审核的系统,所述样本信息包括通过所述风控系统审核的样本和未通过所述风控系统审核且没有被交易系统利用的样本;
在所述样本信息中进行筛选,得到训练样本;
将所述训练样本信息输入机器学习模型,训练得到召回模型;
对所述召回模型进行优化处理,得到目标召回模型。
2.根据权利要求1所述的方法,其特征在于,所述通过风控系统获得样本信息,包括:
获得第一信息、第二信息和第三信息,其中,所述第一信息表征通过所述风控系统第一审核方式审核通过的信息,所述第二信息表征未通过所述风控系统第一审核方式审核的且通过第二审核方式审核的信息,所述第三信息表征均未通过所述风控系统第一审核方式和第二审核方式审核的信息,所述第一审核方式与所述第二审核方式不同;
通过所述第一信息和所述第二信息作为机器学习模型的训练输入,得到第一模型;
利用第一模型对所述第三信息进行评判,得到所述第三信息的第一评分结果;
依据所述第一评分结果,在所述第三信息中筛选得到第一目标样本信息;
根据所述第一信息、所述第二信息和所述第一目标样本信息,生成训练样本信息。
3.根据权利要求2所述的方法,其特征在于,所述依据所述第一评分结果,在所述第三信息中筛选得到第一目标样本信息,包括:
依据所述第一评分结果,获取所述第三信息在各个分数段的样本个数;
利用所述第一模型对所述第一信息和所述第二信息进行评分,得到所述第一信息和所述第二信息在各个分数段的样本个数以及在各个分数段的满足预设第一条件的样本比例,所述预设第一条件表征样本不合格的条件;
依据所述样本比例,确定所述第三信息在各个分数段的目标样本数量,使得能够获得满足风险条件的目标样本信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
利用所述召回模型对所述第二信息进行评分,得到所述第二信息在各个分数段的样本信息,所述样本信息包括样本个数以及满足预设第一条件的样本个数和对应的样本率;
基于所述样本信息,计算所述第二信息的可召回样本个数,所述可召回样本个数表征满足风险条件评分的分数段内的样本个数。
5.根据权利要求1所述的方法,其特征在于,所述对所述召回模型进行优化处理,得到目标召回模型,包括:
利用所述召回模型对所述第三信息进行评判,得到所述第三信息的第二评分结果;
依据所述第二评分结果,在所述第三信息中筛选得到第二目标样本信息;
依据所述第一信息、所述第二信息和所述第二目标样本信息,生成第一训练样本信息;
对所述第一训练样本信息进行模型训练,得到第一召回模型;
利用所述第一召回模型对所述第二信息进行评分,得到所述第二信息在各个分数段的样本信息;
若所述第二信息在各个分数段的样本信息满足预设召...
【专利技术属性】
技术研发人员:苏世前,张磊,张元鹏,曾一林,许卫波,
申请(专利权)人:上海蓝书信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。