一种细分客群的风险识别方法、装置、设备及存储介质制造方法及图纸

技术编号:37993577 阅读:6 留言:0更新日期:2023-06-30 10:07
本申请公开一种细分客群的风险识别方法、装置、设备及存储介质,属于人工智能技术领域。本申请通过构建全量人群的风险预测模型,获取全量预测模型输出的全量预测结果,对全量预测结果进行因子分析,得到因子贡献度,根据因子贡献度筛选聚类因子,并基于聚类因子对全量人群进行聚类,得到细分客群,构建细分客群的风险预测模型,获取细分预测模型输出的细分预测结果,对全量预测结果和细分预测结果进行整合,得到细分客群的风险预测结果。此外,本申请还涉及区块链技术,全量数据和细分客群数据可存储于区块链中。本申请通过建立细分客群风险识别模型,可以更好地针对不同细分客群的风险特征进行识别和评估,从而更加准确地评估客户的风险水平。的风险水平。的风险水平。

【技术实现步骤摘要】
一种细分客群的风险识别方法、装置、设备及存储介质


[0001]本申请属于人工智能
,具体涉及一种细分客群的风险识别方法、装置、设备及存储介质。

技术介绍

[0002]汽车保险精算建模,是通过数学方法对驾驶员出险风险进行建模,从而对车险客户风险预期进行分级,传统风险模型一般是使用全量人群针对少数几个维度,如家用、商用、新车和续保车辆等维度分开来建立模型来预测出险风险。但是由于存在辛普森效应,在细分人群上的出险特征的分布会和整体人群在出险特征的分布存在不同。此外,传统风险模型因为要针对整体人群,所以选取的因子一般需要在整体人群都比较显著,而特定客群上可能存在额外比较显著的因子,因为在整体人群上量比较少无法被整体模型选取。

技术实现思路

[0003]本申请实施例的目的在于提出一种细分客群的风险识别方法、装置、计算机设备及存储介质,以解决现有传统风险模型存储的没有办法识别出部分特定人群的风险特征的技术问题。
[0004]为了解决上述技术问题,本申请实施例提供一种细分客群的风险识别方法,采用了如下所述的技术方案:一种细分客群的风险识别方法,包括:构建全量人群的风险预测模型,得到全量预测模型,并获取所述全量预测模型输出的全量预测结果;对所述全量预测结果进行因子分析,得到因子贡献度,其中,所述因子贡献度为所述全量预测模型中的全量因子对所述全量预测结果的影响程度;根据所述因子贡献度筛选聚类因子,并基于所述聚类因子对所述全量人群进行聚类,得到细分客群;构建所述细分客群的风险预测模型,得到细分预测模型,获取所述细分预测模型输出的细分预测结果;对所述全量预测结果和所述细分预测结果进行整合,得到所述细分客群的风险预测结果。
[0005]进一步地,所述构建全量人群的风险预测模型,得到全量预测模型,并获取所述全量预测模型输出的全量预测结果,具体包括:获取所述全量人群对应的全量数据;对所述全量数据进行数据划分,得到第一训练集和第一验证集;基于预设的梯度提升树算法对所述第一训练集进行模型训练,得到所述全量预测模型;将所述第一验证集导入所述全量预测模型,输出所述全量预测结果。
[0006]进一步地,所述基于预设的梯度提升树算法对所述第一训练集进行模型训练,得到所述全量预测模型,具体包括:将所述第一训练集划分为若干个第一数据子集;基于每一个所述第一数据子集分别构建决策树,得到若干个第一初始决策树;组合所有所述第一初始决策树,构建所述全量预测模型。
[0007]进一步地,所述对所述全量预测结果进行因子分析,得到因子贡献度,具体包括:基于预设的SHAP算法和所述全量预测结果计算每一个所述全量因子的平均Shapley值;基于每一个所述全量因子的平均Shapley值确定每一个所述全量因子的因子贡献度。
[0008]进一步地,根据所述因子贡献度筛选聚类因子,并基于所述聚类因子对所述全量人群进行聚类,得到细分客群,具体包括:对每一个所述全量因子的因子贡献度进行排序,得到因子贡献度序列;根据因子贡献度序列筛选因子贡献度大于预设贡献度阈值的聚类因子;基于所述聚类因子和预设的聚类算法对全量人群进行聚类,得到所述细分客群。
[0009]进一步地,构建所述细分客群的风险预测模型,得到细分预测模型,获取所述细分预测模型输出的细分预测结果,具体包括:获取与所述细分客群关联的细分客群因子;获取细分客群数据,基于所述细分客群因子对所述细分客群数据进行数据筛选,得到筛选数据;对所述筛选数据进行数据划分第二训练集和第二验证集;基于预设的梯度提升树算法对所述第二训练集进行模型训练,得到所述细分预测模型;将所述第二验证集导入所述细分预测模型,输出所述细分预测结果;所述基于预设的梯度提升树算法对所述第二训练集进行模型训练,得到所述细分预测模型,具体包括:将所述第二训练集划分为若干个第二数据子集;从随机选择任意一个所述第二数据子集作为目标数据子集,并基于所述目标数据子集构建第二初始决策树;基于所述第二初始决策树分别计算其他第二数据子集对应的风险预测值;基于每一个所述第二数据子集对应的风险预测值计算对应数据子集的样本残差;基于每一个所述第二数据子集的样本残差分别构建一棵梯度决策树;基于所述第二初始决策树和所有所述梯度决策树构建所述细分预测模型。
[0010]进一步地,所述对所述全量预测结果和所述细分预测结果进行整合,得到所述细分客群的风险预测结果,具体包括:分别计算所述全量预测模型的加权平均值和所述细分预测模型的加权平均值;基于所述全量预测模型的加权平均值和所述细分预测模型的加权平均值对所述全量预测结果和所述细分预测结果进行整合,得到所述细分客群的风险预测结果;或将所述细分预测结果添加到所述第一训练集,得到新的第一训练集;
基于所述梯度提升树算法对所述新的第一训练集重新进行模型训练,得到所述新的全量预测模型;获取所述细分客群数据,将所述细分客群数据导入所述新的全量预测模型,输出所述细分客群的风险预测结果。
[0011]为了解决上述技术问题,本申请实施例还提供一种细分客群的风险识别装置,采用了如下所述的技术方案:一种细分客群的风险识别装置,包括:全量预测模块,用于构建全量人群的风险预测模型,得到全量预测模型,并获取所述全量预测模型输出的全量预测结果;因子分析模块,用于对所述全量预测结果进行因子分析,得到因子贡献度,其中,所述因子贡献度为所述全量预测模型中的全量因子对所述全量预测结果的影响程度;因子筛选模块,用于根据所述因子贡献度筛选聚类因子,并基于所述聚类因子对所述全量人群进行聚类,得到细分客群;细分预测模块,用于构建所述细分客群的风险预测模型,得到细分预测模型,获取所述细分预测模型输出的细分预测结果;结果整合模块,用于对所述全量预测结果和所述细分预测结果进行整合,得到所述细分客群的风险预测结果。
[0012]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上述任一项所述的细分客群的风险识别方法的步骤。
[0013]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上述中任一项所述的细分客群的风险识别方法的步骤。
[0014]与现有技术相比,本申请实施例主要有以下有益效果:本申请公开一种细分客群的风险识别方法、装置、设备及存储介质,属于人工智能
本申请通过构建全量人群的风险预测模型,得到全量预测模型,并获取全量预测模型输出的全量预测结果;对全量预测结果进行因子分析,得到因子贡献度,其中,因子贡献度为全量预测模型中的全量因子对全量预测结果的影响程度;根据因子贡献度筛选聚类因子,并基于聚类因子对全量人群进行聚类,得到细分客群;构建细分客群的风险预测模型,得到细分预测模型,获取细分预测模型输出的细分预测结果;对全量预测结果和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种细分客群的风险识别方法,其特征在于,包括:构建全量人群的风险预测模型,得到全量预测模型,并获取所述全量预测模型输出的全量预测结果;对所述全量预测结果进行因子分析,得到因子贡献度,其中,所述因子贡献度为所述全量预测模型中的全量因子对所述全量预测结果的影响程度;根据所述因子贡献度筛选聚类因子,并基于所述聚类因子对所述全量人群进行聚类,得到细分客群;构建所述细分客群的风险预测模型,得到细分预测模型,获取所述细分预测模型输出的细分预测结果;对所述全量预测结果和所述细分预测结果进行整合,得到所述细分客群的风险预测结果。2.根据权利要求1所述的细分客群的风险识别方法,其特征在于,所述构建全量人群的风险预测模型,得到全量预测模型,并获取所述全量预测模型输出的全量预测结果,具体包括:获取所述全量人群对应的全量数据;对所述全量数据进行数据划分,得到第一训练集和第一验证集;基于预设的梯度提升树算法对所述第一训练集进行模型训练,得到所述全量预测模型;将所述第一验证集导入所述全量预测模型,输出所述全量预测结果。3.根据权利要求2所述的细分客群的风险识别方法,其特征在于,所述基于预设的梯度提升树算法对所述第一训练集进行模型训练,得到所述全量预测模型,具体包括:将所述第一训练集划分为若干个第一数据子集;基于每一个所述第一数据子集分别构建决策树,得到若干个第一初始决策树;组合所有所述第一初始决策树,构建所述全量预测模型。4.根据权利要求1所述的细分客群的风险识别方法,其特征在于,所述对所述全量预测结果进行因子分析,得到因子贡献度,具体包括:基于预设的SHAP算法和所述全量预测结果计算每一个所述全量因子的平均Shapley值;基于每一个所述全量因子的平均Shapley值确定每一个所述全量因子的因子贡献度。5.根据权利要求4所述的细分客群的风险识别方法,其特征在于,根据所述因子贡献度筛选聚类因子,并基于所述聚类因子对所述全量人群进行聚类,得到细分客群,具体包括:对每一个所述全量因子的因子贡献度进行排序,得到因子贡献度序列;根据因子贡献度序列筛选因子贡献度大于预设贡献度阈值的聚类因子;基于所述聚类因子和预设的聚类算法对全量人群进行聚类,得到所述细分客群。6.根据权利要求2所述的细分客群的风险识别方法,其特征在于,构建所述细分客群的风险预测模型,得到细分预测模型,获取所述细分预测模型输出的细分预测结果,具体包括:获取与所述细分客群关联的细分客群因子;获取细分客群数据,基于所述细分客群因子对所述细分客群数据进行数据筛选,得到
筛选数据;对所述筛选数据进行数据划分第二训练集和第二验证集;基于预设的...

【专利技术属性】
技术研发人员:张霖陈志坚张颖朱旭音朱艳乔
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1