一种风险评估方法及装置制造方法及图纸

技术编号:24709635 阅读:68 留言:0更新日期:2020-07-01 00:13
本发明专利技术实施例提供一种风险评估方法及装置,其中方法包括:获取待预测用户所对应的特征数据;将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果;其中,所述评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且所述标签数据已预先通过预设切分点进行二分类切分。本发明专利技术实施例实现了通过评分卡模型对多种应用场景的预测。

【技术实现步骤摘要】
一种风险评估方法及装置
本专利技术涉及风险评估
,尤其涉及一种风险评估方法及装置。
技术介绍
评分卡是一种常见的机器学习模型,典型应用场景包括银行放贷和企业征信等,旨在根据个人的基本信息拟合信用状况进行分数计算。评分卡已经成为具有严密理论和方法体系的信用评价手段。但是,经典评分卡仅适用于小数据量,高覆盖率和高准确性的数据场景中,且只能适用二分类业务场景,而对于互联网海量,低覆盖和低质量的数据场景没有系统性的解决方案,例如在关键数据缺失率极高的数据场景中则不适用,且并不能适用多种业务场景。
技术实现思路
本专利技术实施例提供一种风险评估方法及装置,以解决现有技术中只能采用评分模型对二分类业务场景进行风险评估的问题。本专利技术实施例提供一种风险评估方法,包括:获取待预测用户所对应的特征数据;将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果;其中,所述评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且所述标签数据已预先通过预设切分点进行二分类切分。可选地,所述将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的预测结果之前,还包括:获取样本用户所对应的样本特征数据和真实风险值;当所述样本特征数据的缺失率大于预设缺失阈值时,通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,所述填充后数据包括填充后特征数据和所述样本特征数据所对应的标签数据;通过所述填充后数据对预设二分类模型进行训练,得到训练后模型;通过所述样本特征数据和所述真实风险值对所述训练后模型进行准确度测试,并当所述训练后模型的准确度大于预设准确度阈值时,将所述训练后模型确定为所述评分卡模型。可选地,所述通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,包括:当所述样本特征数据的数据类型为连续型时,通过线性模型对所述样本特征数据进行填充,得到填充后数据;当所述样本特征数据的数据类型为二分类型时,通过逻辑回归模型对所述样本特征数据进行填充,得到填充后数据;当所述样本特征数据的数据类型为无序多分类型时,通过Softmax模型对所述样本特征数据进行填充,得到填充后数据;当所述样本特征数据的数据类型为有序多分类型时,通过有序多分类模型对所述样本特征数据进行填充,得到填充后数据。可选地,所述通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,包括:获取所述样本特征数据中缺失率由低到高的数据位置排列顺序;按照所述缺失率由低到高的数据位置排列顺序,依次对缺失数据进行填充,得到填充后数据。可选地,所述通过所述填充后数据对预设二分类模型进行训练,得到训练后模型,包括:通过预设切分点对所述标签数据进行切分,并对分属于预设切分点两侧的标签数据分别进行二分类标记;通过所述填充后特征数据和进行二分类标记后的标签数据对所述预设二分类模型进行训练,得到训练后数据。可选地,当所述标签数据的数据类型为连续型时,所述通过预设切分点对所述标签数据进行切分之前,还包括:通过反向映射,将所述标签数据转换为sigmoid曲线;根据所述sigmoid曲线,确定所述标签数据所对应的切分点,并将所确定的切分点确定为预设切分点。本专利技术实施例还提供一种风险评估装置,包括:第一获取模块,用于获取待预测用户所对应的特征数据;第二获取模块,用于将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果;其中,所述评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且所述标签数据已预先通过预设切分点进行二分类切分。本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的风险评估方法的步骤。本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的风险评估方法的步骤。本专利技术实施例提供的风险评估方法及装置,通过在获取到待预测用户所对应的特征数据后,然后将特征数据输入至评分卡模型中,得到评分卡模型输出的风险预测结果,其中评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且标签数据已预先通过预设切分点进行二分类切分,这使得训练到的评分卡模型不仅能够适用于二分类数据,还能够适用于其他类型数据,从而实现了该评分卡模型能够适应于连续型数据、无序多分类型数据和有序多分类数据等多类型数据,从而扩展了评分卡模型的应用场景,使得评分卡模型能够适应多种业务的数据类型,避免了现有评分卡模型只能对二分类业务场景进行评分预测的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中风险评估方法的步骤流程图;图2为本专利技术实施例中得到评分卡模型的步骤流程图;图3为本专利技术实施例中样本特征数据的示意图;图4为本专利技术实施例中对样本特征数据进行填充后的示意图;图5为本专利技术实施例中采用填充后数据对预设二分类模型进行训练时的示意图;图6为本专利技术实施例中采用样本特征数据对训练后数据进行准确度测试时的示意图;图7为本专利技术实施例中风险评估装置的模块框图;图8为本专利技术实施例中电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,为本专利技术实施例中风险评估方法的步骤流程图,该方法包括如下步骤:步骤101:获取待预测用户所对应的特征数据。在本步骤中,具体的,在对用户进行风险评估时可以先获取待预测用户所对应的特征数据。此外,具体的,待预测用户可以对应与风险预测相关的多类特征数据,在此并不对此进行具体限定。例如可以包括用户的年龄、学历、地域、资产分布情况以及收入等多类特征数据。步骤102:将特征数据输入至评分卡模型中,得到评分卡模型输出的风险预测结果。在本步骤中,可以直接将获取到的特征数据输入至评分卡模型中,得到评分卡模型输出的风险预测结果。其中,该评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练本文档来自技高网...

【技术保护点】
1.一种风险评估方法,其特征在于,包括:/n获取待预测用户所对应的特征数据;/n将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果;/n其中,所述评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且所述标签数据已预先通过预设切分点进行二分类切分。/n

【技术特征摘要】
1.一种风险评估方法,其特征在于,包括:
获取待预测用户所对应的特征数据;
将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果;
其中,所述评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且所述标签数据已预先通过预设切分点进行二分类切分。


2.根据权利要求1所述的风险评估方法,其特征在于,所述将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果之前,还包括:
获取样本用户所对应的样本特征数据和真实风险值;
当所述样本特征数据的缺失率大于预设缺失阈值时,通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,所述填充后数据包括填充后特征数据和所述样本特征数据所对应的标签数据;
通过所述填充后数据对预设二分类模型进行训练,得到训练后模型;
通过所述样本特征数据和所述真实风险值对所述训练后模型进行准确度测试,并当所述训练后模型的准确度大于预设准确度阈值时,将所述训练后模型确定为所述评分卡模型。


3.根据权利要求2所述的风险评估方法,其特征在于,所述通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,包括:
当所述样本特征数据的数据类型为连续型时,通过线性模型对所述样本特征数据进行填充,得到填充后数据;
当所述样本特征数据的数据类型为二分类型时,通过逻辑回归模型对所述样本特征数据进行填充,得到填充后数据;
当所述样本特征数据的数据类型为无序多分类型时,通过Softmax模型对所述样本特征数据进行填充,得到填充后数据;
当所述样本特征数据的数据类型为有序多分类型时,通过有序多分类模型对所述样本特征数据进行填充,得到填充后数据。


4.根据权利要求2所述的风险评估方法,其特征在于,所述通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,包括:
获取所述样本特征数据中缺失率由低到高的数据位置排列顺序;
按照所述缺失率由低到高的数据位置排列顺序,依次对缺失数据进行填充,得到填充后数据。


5.根据权利要求2所述的风险评估方法,其特征...

【专利技术属性】
技术研发人员:梅止观贺欧文李诗诗
申请(专利权)人:北京贝壳时代网络科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1