信用风险识别方法、装置、设备及存储介质制造方法及图纸

技术编号:30829034 阅读:58 留言:0更新日期:2021-11-18 12:37
本申请涉及人工智能技术,提供一种信用风险识别方法、装置、设备及存储介质,该方法包括:获取待投保用户在以往贷款时记录的用户资质数据、信息变更数据和用户标签数据;将用户资质数据输入至预先训练好的随机森林模型进行分类,得到第一信用风险等级;将信息变更数据输入至训练好的梯度提升树模型进行预测,得到多个风险类别对应的概率信息,根据多个概率信息确定第二信用风险等级;根据用户标签数据和预设聚类算法,确定第三信用风险等级;根据第一信用风险等级、第二信用风险等级和第三信用风险等级,确定信用风险识别结果。本申请还涉及区块链,能够提高投保险用户进行信用风险识别的准确率。识别的准确率。识别的准确率。

【技术实现步骤摘要】
信用风险识别方法、装置、设备及存储介质


[0001]本申请涉及智能决策的
,尤其涉及一种信用风险识别方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术的不断发展,针对企业进行保险投保评估的技术也在不断的完善中,企业保险投保评估需要判断企业用户信用风险。2020年我国新增注册市场主体2735.4万家,截至2021年2月,我国共有在业/存续的市场主体1.44亿家。然而,虽然拥有庞大的市场主体基数和新增量,目前采取的判断企业用户信用风险的办法主要是以历史违约与否作为判断依据,例如查询企业征信报告来判断企业的信用风险等级,对于投保险企业的信用风险识别准确率较低。因此,如何有效提高企业进行投保险评估的信用风险识别准确率,成为了亟需解决的问题。

技术实现思路

[0003]本申请的主要目的在于提供一种信用风险识别方法、装置、设备及存储介质,旨在提高投保险用户进行信用风险识别的准确率。
[0004]第一方面,本申请提供一种信用风险识别方法,包括:
[0005]获取待投保用户的贷款历史数据,所述贷款历史数据包括所述待投保用户在以往贷款时记录的用户资质数据、信息变更数据和用户标签数据;
[0006]将所述用户资质数据输入至预先训练好的随机森林模型进行分类,得到第一信用风险等级;
[0007]将所述信息变更数据输入至训练好的梯度提升树模型进行预测,得到多个风险类别对应的概率信息,根据多个所述概率信息确定第二信用风险等级;
[0008]根据所述用户标签数据和预设聚类算法,确定第三信用风险等级;
[0009]根据所述第一信用风险等级、第二信用风险等级和第三信用风险等级,确定所述待投保用户的信用风险识别结果。
[0010]第二方面,本申请还提供一种信用风险识别装置,所述信用风险识别装置包括:
[0011]获取模块,用于获取待投保用户的贷款历史数据,所述贷款历史数据包括所述待投保用户在以往贷款时记录的用户资质数据、信息变更数据和用户标签数据;
[0012]分类模块,用于将所述用户资质数据输入至预先训练好的随机森林模型进行分类,得到第一信用风险等级;
[0013]预测模块,用于将所述信息变更数据输入至训练好的梯度提升树模型进行预测,得到多个风险类别对应的概率信息,根据多个所述概率信息确定第二信用风险等级;
[0014]聚类模块,用于根据所述用户标签数据和预设聚类算法,确定第三信用风险等级;
[0015]确定模块,用于根据所述第一信用风险等级、第二信用风险等级和第三信用风险等级,确定所述待投保用户的信用风险识别结果。
[0016]第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的信用风险识别方法的步骤。
[0017]第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上所述的信用风险识别方法的步骤。
[0018]本申请提供一种信用风险识别方法、装置、设备及存储介质,本申请通过获取待投保用户的贷款历史数据,贷款历史数据包括待投保用户在以往贷款时记录的用户资质数据、信息变更数据和用户标签数据;将用户资质数据输入至预先训练好的随机森林模型进行分类,得到第一信用风险等级;将信息变更数据输入至训练好的梯度提升树模型进行预测,得到多个风险类别对应的概率信息,根据多个概率信息确定第二信用风险等级;根据用户标签数据和预设聚类算法,确定第三信用风险等级;根据第一信用风险等级、第二信用风险等级和第三信用风险等级,确定待投保用户的信用风险识别结果。通过多维度的特征数据选取合适的模型和算法进行企业用户的信用风险等级的评估,避免了单一维度数据和模型算法缺陷造成信用风险评估的偏向性差异,能够提高投保险用户进行信用风险识别的准确率,合理规避企业借贷履约的安全风险。
附图说明
[0019]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本申请实施例提供的一种信用风险识别方法的步骤流程示意图;
[0021]图2为图1中的信用风险识别方法的子步骤流程示意图;
[0022]图3为本申请实施例提供的一种信用风险识别装置的示意性框图;
[0023]图4为图3中的信用风险识别装置的子模块的示意性框图;
[0024]图5为本申请实施例提供的一种计算机设备的结构示意性框图。
[0025]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0026]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0027]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
[0028]本申请实施例提供一种信用风险识别方法、装置、设备及存储介质。其中,该信用风险识别方法可应用于终端设备或服务器中,该终端设备可以为手机、平板电脑、笔记本电
脑、台式电脑、个人数字助理和穿戴式设备等电子设备;该服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。以下以该信用风险识别方法应用于服务器为例进行解释说明。
[0029]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0030]请参照图1,图1为本申请实施例提供的一种信用风险识别方法的步骤流程示意图。
[0031]如图1所示,该信用风险识别方法包括步骤S101至步骤S105。
[0032]步骤S101、获取待投保用户的贷款历史数据,贷款历史数据包括待投保用户在以往贷款时记录的用户资质数据、信息变更数据和用户标签数据。
[0033]其中,贷款历史数据为待投保用户在以往贷款时记录的历史数据,用户资质数据包括用户住址、成立日期、行业分类、企业规模、社保缴纳人数、纳税额等资质数据;信息变更数据包括企业信息变更数据和/或贷款信息更新数据,企业信息变更数据包括法人变更、股东变更等数据,贷款信息更新数据包括是否如期还款记录、申请新的贷款记录等数据;用户标签数据包括成立时间、营业规模、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信用风险识别方法,其特征在于,包括:获取待投保用户的贷款历史数据,所述贷款历史数据包括所述待投保用户在以往贷款时记录的用户资质数据、信息变更数据和用户标签数据;将所述用户资质数据输入至预先训练好的随机森林模型进行分类,得到第一信用风险等级;将所述信息变更数据输入至训练好的梯度提升树模型进行预测,得到多个风险类别对应的概率信息,根据多个所述概率信息确定第二信用风险等级;根据所述用户标签数据和预设聚类算法,确定第三信用风险等级;根据所述第一信用风险等级、第二信用风险等级和第三信用风险等级,确定所述待投保用户的信用风险识别结果。2.如权利要求1所述的信用风险识别方法,其特征在于,所述根据所述用户标签数据和预设聚类算法,确定第三信用风险等级,包括:对所述用户标签数据进行分词处理,以获取标签特征数据集;根据预设聚类算法对所述标签特征数据集进行聚类处理,得到聚类结果;根据所述聚类结果确定第三信用风险等级。3.如权利要求2所述的信用风险识别方法,其特征在于,所述根据预设聚类算法对所述标签特征数据集进行聚类处理,得到聚类结果,包括:根据预设聚类算法计算所述标签特征数据集中的多个标签特征数据的位置坐标;根据多个所述标签特征数据的位置坐标,在预设坐标系中生成多个节点;根据多个所述节点的位置坐标,计算每两个所述节点之间的欧式距离;根据每两个所述节点之间的欧式距离,对多个所述节点进行聚类,得到至少一个聚类簇。4.如权利要求2所述的信用风险识别方法,其特征在于,所述根据所述聚类结果确定第三信用风险等级,包括:确定所述聚类结果与预设的多个样本聚类结果中的每个样本聚类结果之间的匹配度;从多个所述匹配度中选取目标匹配度,并将所述目标匹配度对应的信用风险等级作为第三信用风险等级。5.如权利要求1所述的信用风险识别方法,其特征在于,所述信息变更数据包括企业信息变更数据和贷款信息更新数据;所述将所述信息变更数据输入至训练好的梯度提升树模型进行预测,得到多个风险类别对应的概率信息,包括:根据所述企业信息变更数据和贷款信息更新数据,生成数据样本对;将所述数据样本对输入至训练好的梯度提升树模型进行处理,得到多个风险类别以及每个所述风险类别对应的概率信息;所述根据多个所述概率信息确定第二信用风险等级,包括:从多个所述概率信息中确定数值最大的目标概率信息,并确定所述目标概率信息对应的目标风险类别;根据...

【专利技术属性】
技术研发人员:童阳伍勇
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1