基于人工智能的检测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38972111 阅读:30 留言:0更新日期:2023-09-28 09:36
本申请属于金融科技技术领域,涉及一种基于人工智能的检测方法及其相关设备,该方法包括获取待检测企业的当前结案信息;根据黑名单列表对待检测企业进行筛选,得到筛选后的待检测企业;基于LGBM算法对筛选后的待检测企业进行二分类,得到二分类后的数据集;根据二分类后的数据集构建初始模型;基于决策树算法迭代训练初始模型,得到最优模型以及至少两个风险特征的权重;将所述至少两个风险特征的权重的大小进行比对,得到比对结果;根据所述比对结果,确定待检测企业存在的风险。本申请还涉及区块链技术,企业结案信息与模型可存储于区块链中。本申请通过LGBM算法可以高效的处理问题,减少数据量,减少内存压力,保证模型的训练精度。精度。精度。

【技术实现步骤摘要】
基于人工智能的检测方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能中的金融科技
,尤其涉及基于人工智能的检测方法、装置、计算机设备及存储介质。

技术介绍

[0002]团体保险(企业保险)在大部分财产险公司中属于比较特殊的存在。单量少但涉及的保费却高,且为了适应各大公司,对推出的产品的自定义属性较多,随之而来带来的风险也高很多。
[0003]在现有的团体理赔风控中,该团体理赔风控平台/系统具有申请贷款、信用卡或者购买保险、理财产品等功能,该团体理赔风控平台/系统对团体保险的大多基于是基于企业所在的行业和城市来判断。
[0004]然而,申请人发现,传统的团体理赔风控并未获取企业的具体信息,因此会存在较大的局限性。企业自身存在的大量的风险特征未被挖掘,也缺少对显著特征及特征对应的权重分析,导致风险评估模型的偏差大,准确率也较低。

技术实现思路

[0005]本申请实施例的目的在于提出一种基于人工智能的检测方法、装置、计算机设备及存储介质,以解决现有技术中对企业自身存在的大量的风险特征未被挖掘,也缺少对显著特征及特征对应的权重分析,导致风险评估模型的偏差大,准确率也较低的技术问题。
[0006]为了解决上述技术问题,本申请实施例提供一种基于人工智能的检测方法,包括下述步骤:
[0007]获取待检测企业的当前结案信息;
[0008]根据黑名单列表对所述待检测企业进行筛选,得到筛选后的待检测企业;
[0009]基于LGBM算法对所述筛选后的待检测企业进行二分类,得到二分类后的数据集;
[0010]根据所述二分类后的数据集构建初始模型;
[0011]基于决策树算法迭代训练所述初始模型,得到最优模型以及至少两个风险特征的权重;
[0012]将所述至少两个风险特征的权重的大小进行比对,得到比对结果;
[0013]根据所述比对结果,确定所述待检测企业存在的风险。
[0014]进一步地,所述根据黑名单列表对所述待检测企业进行筛选,得到筛选后的待检测企业的步骤包括:
[0015]将所有的待检测企业与黑名单列表进行黑名单匹配,得到匹配结果,所述黑名单列表包括黑产业的企业、黑区域的企业以及存在历史欺诈风险的企业;
[0016]若所述匹配结果存在匹配成功的待检测企业,则剔除所述匹配成功的待检测企业,并将剩余的待检测企业作为所述筛选后的待检测企业。
[0017]进一步地,所述基于LGBM算法对所述筛选后的待检测企业进行二分类,得到二分
类后的数据集的步骤包括:
[0018]设置风险特征的权重,并对所述风险特征的权重进行负梯度拟合计算,获得所述风险特征的权重的梯度绝对值;
[0019]基于LGBM算法将所述风险特征的权重的梯度绝对值进行预排序;
[0020]选取梯度绝对值最高的最高权重组,以及随机选取的随机权重组,组合得到二分类后的数据集。
[0021]进一步地,所述基于LGBM算法将所述风险特征的权重的梯度绝对值进行预排序的步骤包括:
[0022]确定所述风险特征的权重的梯度绝对值中的最高值与最低值;
[0023]将除所述最高值与所述最低值的剩余所述风险特征的权重的梯度绝对值依次排序在所述最高值与所述最低值之间。
[0024]进一步地,所述选取梯度绝对值最高的最高权重组,以及随机选取的随机权重组,组合得到二分类后的数据集的步骤包括:
[0025]预设大梯度的抽样比为大梯度抽样值,小梯度抽样比为小梯度抽样值;
[0026]将提取所述风险特征的权重的梯度绝对值中高于所述大梯度抽样值为大梯度抽样组,所述风险特征的权重的梯度绝对值中低于所述小梯度抽样值为小梯度抽样组;
[0027]放大所述小梯度抽样组的数据集;
[0028]基于GOSS算法计算所述大梯度抽样组以及放大后的所述小梯度抽样组的信息增益,并将计算后组合得到二分类后的数据集。
[0029]进一步地,所述基于决策树算法迭代训练所述初始模型,得到最优模型以及至少两个风险特征的权重的步骤包括:
[0030]将所述筛选后的待检测企业的当前结案信息设置为对象节点,并确定最优的权重的梯度绝对值,根据所述最优的权重的梯度绝对值将所述二分类后的数据集分割成子集;
[0031]将所有所述子集按所述对象节点的当前结案信息进行递归与分割;
[0032]分类所有所述递归与分割后的子集;
[0033]构建叶节点,并将所有所述分类后的子集分到对应类别的所述叶节点中,得到最优模型,其中,所述最优模型包括至少两个风险特征的权重。
[0034]进一步地,所述构建叶节点,并将所有所述分类后的子集分到对应类别的所述叶节点中,得到最优模型的步骤之后,所述方法还包括:
[0035]确定所述至少两个风险特征的权重的绝对值,并对比所述至少两个风险特征的权重的绝对值;
[0036]提取所述权重的绝对值最高的风险特征,并将权重的绝对值最高的风险特征作为待检测企业的风险标签;
[0037]根据所述风险标签确定所述待检测企业存在的风险。
[0038]为了解决上述技术问题,本申请实施例还提供一种基于人工智能的检测装置,包括:
[0039]获取模块,用于获取待检测企业的当前结案信息;
[0040]筛选模块,用于根据黑名单列表对所述待检测企业进行筛选,得到筛选后的待检测企业;
[0041]分类模块,用于基于LGBM算法对所述筛选后的待检测企业进行二分类,得到二分类后的数据集;
[0042]构建模块,用于根据所述二分类后的数据集构建初始模型;
[0043]训练模块,用于基于决策树算法迭代训练所述初始模型,得到最优模型以及至少两个风险特征的权重;
[0044]比对模块,用于将所述至少两个风险特征的权重的大小进行比对,得到比对结果;
[0045]确定模块,用于根据所述比对结果,确定所述待检测企业存在的风险。
[0046]为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上任意所述的基于人工智能的检测方法的步骤。
[0047]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上任意所述的基于人工智能的检测方法的步骤。
[0048]与现有技术相比,本申请实施例主要有以下有益效果:
[0049]本申请提供的技术方案,通过获取待检测企业的当前结案信息;根据黑名单列表对所述待检测企业进行筛选,得到筛选后的待检测企业;基于LGBM算法对所述筛选后的待检测企业进行二分类,得到二分类后的数据集;根据所述二分类后的数据集构建初始模型;基于决策树算法迭代训练所述初始模型,得到最优模型以及至少两个风险特征的权重;将所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的检测方法,其特征在于,包括下述步骤:获取待检测企业的当前结案信息;根据黑名单列表对所述待检测企业进行筛选,得到筛选后的待检测企业;基于LGBM算法对所述筛选后的待检测企业进行二分类,得到二分类后的数据集;根据所述二分类后的数据集构建初始模型;基于决策树算法迭代训练所述初始模型,得到最优模型以及至少两个风险特征的权重;将所述至少两个风险特征的权重的大小进行比对,得到比对结果;根据所述比对结果,确定所述待检测企业存在的风险。2.根据权利要求1所述的基于人工智能的检测方法,其特征在于,所述根据黑名单列表对所述待检测企业进行筛选,得到筛选后的待检测企业的步骤包括:将所有的待检测企业与黑名单列表进行黑名单匹配,得到匹配结果,所述黑名单列表包括黑产业的企业、黑区域的企业以及存在历史欺诈风险的企业;若所述匹配结果存在匹配成功的待检测企业,则剔除所述匹配成功的待检测企业,并将剩余的待检测企业作为所述筛选后的待检测企业。3.根据权利要求1所述的基于人工智能的检测方法,其特征在于,所述基于LGBM算法对所述筛选后的待检测企业进行二分类,得到二分类后的数据集的步骤包括:设置风险特征的权重,并对所述风险特征的权重进行负梯度拟合计算,获得所述风险特征的权重的梯度绝对值;基于LGBM算法将所述风险特征的权重的梯度绝对值进行预排序;选取梯度绝对值最高的最高权重组,以及随机选取的随机权重组,组合得到二分类后的数据集。4.根据权利要求3所述的基于人工智能的检测方法,其特征在于,所述基于LGBM算法将所述风险特征的权重的梯度绝对值进行预排序的步骤包括:确定所述风险特征的权重的梯度绝对值中的最高值与最低值;将除所述最高值与所述最低值的剩余所述风险特征的权重的梯度绝对值依次排序在所述最高值与所述最低值之间。5.根据权利要求4所述的基于人工智能的检测方法,其特征在于,所述选取梯度绝对值最高的最高权重组,以及随机选取的随机权重组,组合得到二分类后的数据集的步骤包括:预设大梯度的抽样比为大梯度抽样值,小梯度抽样比为小梯度抽样值;将提取所述风险特征的权重的梯度绝对值中高于所述大梯度抽样值为大梯度抽样组,所述风险特征的权重的梯度绝对值中低于所述小梯度抽样值为小梯度抽样组;放大所述小梯度抽样组的数据集;基于GOSS...

【专利技术属性】
技术研发人员:陈奕宇
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1