当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于大数据的用户信息评估及风控方法、装置及设备制造方法及图纸

技术编号:35752134 阅读:8 留言:0更新日期:2022-11-26 18:58
本发明专利技术提供一种基于大数据的用户信息评估及风控方法、装置及设备,其中,方法通过将获取到的历史用户的基本信息进行去标识化处理,得到初始数据;并将初始数据上传至云端,进行数据清洗处理,从而得到目标数据;再根据预设的模型对目标数据进行特征选择,进一步得到目标特征;然后根据目标特征建立风控模型,并用历史用户的基本信息对风控模型进行训练,得到目标风控模型;最终根据目标风控模型对待审核用户进行风控评估,实现对用户的定量风控评估,提高了贷前风控评估的效率和准确性。提高了贷前风控评估的效率和准确性。提高了贷前风控评估的效率和准确性。

【技术实现步骤摘要】
一种基于大数据的用户信息评估及风控方法、装置及设备


[0001]本专利技术涉及风险评估
,尤其涉及一种基于大数据的用户信息评估及风控方法、装置及设备。

技术介绍

[0002]近年来,为了弥补面向中低收入群体和微小企业的金融产品支持的空白,发展小额信贷。其中,涌现出了一些专业的小额信贷公司,接着几大银行也陆续开展了小额信贷业务。但是由于消费者认知度低等问题,在行业的前期发展阶段,市场比较混乱。也存在着贷款人难以偿还贷款的风险,故对于如何评估贷款人风险则成为了贷款业务的重中之重。
[0003]由于信贷的贷款风险往往在在贷款审查阶段就产生了,因此,行业以往多采用的定性风险评估,然而事实证明,定性的风险评估难以真实反应贷款人的还款能力。故现在行业越来越着重于采用定量风险评估的方式,而对于如何具体运用定量风险评估进行风控管理,是一个急需解决的问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种基于大数据的用户信息评估及风控方法、装置及设备。
[0005]一种基于大数据的用户信息评估及风控方法,所述方法包括:获取历史用户的基本信息,所述基本信息分为用户信息和贷款信息;对所述基本信息进行去标识化处理,得到初始数据;将所述初始数据上传并存储至云端;在云端对所述初始数据进行数据清洗处理,得到目标数据;根据预设的模型对所述目标数据进行特征选择,得到目标特征;根据所述目标特征建立风控模型,并根据所述历史用户的基本信息对所述风控模型进行训练,得到目标风控模型;获取待审核用户的初始信息,并根据所述目标风控模型对所述待审核用户进行风控评估。
[0006]在其中一个实施例中,所述基本信息分为用户信息和贷款信息,具体为:所述用户信息至少包括用户姓名、用户性别、个人征信、婚姻状况、配偶征信、工作情况、个人守约行为;所述贷款信息至少包括贷款次数、还款情况、贷款金额、贷款时间。
[0007]在其中一个实施例中,对所述基本信息进行去标识化处理,得到初始数据,具体为:通过数据转换将所述基本信息转换为多个类型的字节,并根据每个所述历史用户的基本信息创建对应的数据集;对所述数据集中可识别个人信息的字节进行标记,得到标记字节;根据所述标记字节的类型,分别进行去除和抽象化处理,得到目标字节;所述目标字节组成数据集,根据所述数据集得到初始数据。
[0008]在其中一个实施例中,所述在云端对所述初始数据进行数据清洗处理,得到目标数据,具体为:对存储在云端的所述初始数据进行缺失值过滤;并对所述初始数据进行经验性数据过滤,得到目标数据。
[0009]在其中一个实施例中,所述预设的模型为逻辑回归模型、梯度提升树模型中的一
种。
[0010]在其中一个实施例中,所述根据预设的模型对所述目标数据进行特征选择,得到目标特征,具体为:根据预设的评估准则,对所述目标数据中各数据集中的目标字节进行逻辑计算,得到初始特征;对所述初始特征进行抽象化、分箱和缩放处理,得到待选择特征;根据预设的模型对所述待选择特征进行选择,得到目标特征。
[0011]在其中一个实施例中,根据所述目标特征建立风控模型,并根据所述历史用户的基本信息对所述风控模型进行训练,得到目标风控模型步骤之后,还包括:获取待审核用户的行程信息和初始信息,所述初始信息中至少包括工作地点;识别所述行程信息中单月前往银行或金融机构等非工作地点的频率;将所述评率高于预设阈值的待审核用户,标记为潜在危险;将所述标记有潜在危险的待审核用户设置为携带有初始风险值。
[0012]在其中一个实施例中,所述获取待审核用户的初始信息,并根据所述目标风控模型对所述待审核用户进行风控评估步骤之后,还包括:根据所述目标风控模型,得到待审核用户的风险评估值;并将所述初始风险值与所述风险评估值叠加,得到目标风险评估值。
[0013]一种基于大数据的用户信息评估及风控装置,包括信息获取模块、去标识化模块、上传云端模块、数据清洗模块、特征选择模块、风控建模模块和风控评估模块,其中:所述信息获取模块用于,获取历史用户的基本信息,所述基本信息分为用户信息和贷款信息;所述去标识化模块用于,对所述基本信息进行去标识化处理,得到初始数据;所述上传云端模块用于,将所述初始数据上传并存储至云端;所述数据清洗模块用于,在云端对所述初始数据进行数据清洗处理,得到目标数据;所述特征选择模块用于,根据预设的模型对所述目标数据进行特征选择,得到目标特征;所述风控建模模块用于,根据所述目标特征建立风控模型,并根据所述历史用户的基本信息对所述风控模型进行训练,得到目标风控模型;所述风控评估模块用于,获取待审核用户的初始信息,并根据所述目标风控模型对所述待审核用户进行风控评估。
[0014]一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的一种基于大数据的用户信息评估及风控方法的步骤。
[0015]上述一种基于大数据的用户信息评估及风控方法、装置及设备,通过将获取到的历史用户的基本信息进行去标识化处理,得到初始数据;并将初始数据上传至云端,进行数据清洗处理,从而得到目标数据;再根据预设的模型对目标数据进行特征选择,进一步得到目标特征;然后根据目标特征建立风控模型,并用历史用户的基本信息对风控模型进行训练,得到目标风控模型;最终根据目标风控模型对待审核用户进行风控评估,实现对用户的定量风控评估,提高了贷前风控评估的效率和准确性。
附图说明
[0016]图1为一个实施例中一种基于大数据的用户信息评估及风控方法的应用场景图;
[0017]图2为一个实施例中一种基于大数据的用户信息评估及风控方法的流程示意图;
[0018]图3为一个实施例中一种基于大数据的用户信息评估及风控装置的结构框图;
[0019]图4是一个实施例中设备的内部结构图。
具体实施方式
[0020]为了使本专利技术的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本专利技术做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0021]本申请提供的一种基于大数据的用户信息评估及风控方法,可以应用于如图1所示的应用环境中。其中,每个用户即拥有一个终端1,终端1将用户的基本信息上传至云端2,在云端2进行数据存储和数据运算,能够极大的提高计算的效率。其中,每个用户都有一个终端1,终端1可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
[0022]在一个实施例中,如图2所示,提供了一种基于大数据的用户信息评估及风控方法,包括以下步骤:
[0023]S110获取历史用户的基本信息,基本信息分为用户信息和贷款信息。
[0024]具体地,这里的历史用户为已经贷过款的用户,当获取的历史用户越多,则后面进行特征提取时,得到的定量评估也更加准确。
[0025]在一个实施例中,步骤S110具体为:用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的用户信息评估及风控方法,其特征在于,包括:获取历史用户的基本信息,所述基本信息分为用户信息和贷款信息;对所述基本信息进行去标识化处理,得到初始数据;将所述初始数据上传并存储至云端;在云端对所述初始数据进行数据清洗处理,得到目标数据;根据预设的模型对所述目标数据进行特征选择,得到目标特征;根据所述目标特征建立风控模型,并根据所述历史用户的基本信息对所述风控模型进行训练,得到目标风控模型;获取待审核用户的初始信息,并根据所述目标风控模型对所述待审核用户进行风控评估。2.如权利要求1所述的方法,其特征在于,所述基本信息分为用户信息和贷款信息,具体为:所述用户信息至少包括用户姓名、用户性别、个人征信、婚姻状况、配偶征信、工作情况、个人守约行为;所述贷款信息至少包括贷款次数、还款情况、贷款金额、贷款时间。3.如权利要求2所述的方法,其特征在于,对所述基本信息进行去标识化处理,得到初始数据,具体为:通过数据转换将所述基本信息转换为多个类型的字节,并根据每个所述历史用户的基本信息创建对应的数据集;对所述数据集中可识别个人信息的字节进行标记,得到标记字节;根据所述标记字节的类型,分别进行去除和抽象化处理,得到目标字节;所述目标字节组成数据集,根据所述数据集得到初始数据。4.如权利要求3所述的方法,其特征在于,所述在云端对所述初始数据进行数据清洗处理,得到目标数据,具体为:对存储在云端的所述初始数据进行缺失值过滤;并对所述初始数据进行经验性数据过滤,得到目标数据。5.如权利要求1所述的方法,其特征在于,所述预设的模型为逻辑回归模型、梯度提升树模型中的一种。6.如权利要求4所述的方法,其特征在于,所述根据预设的模型对所述目标数据进行特征选择,得到目标特征,具体为:根据预设的评估准则,对所述目标数据中各数据集中的目标字节进行逻辑计算,得到初始特征;对所述初始特征进行抽象化、分箱和缩放处理,得到待选择特征;...

【专利技术属性】
技术研发人员:陈逢章
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1