【技术实现步骤摘要】
一种理赔结果预测方法、装置、设备及其存储介质
[0001]本申请涉及金融科技
,应用于车险理赔结果预测场景中,尤其涉及一种理赔结果预测方法
、
装置
、
设备及其存储介质
。
技术介绍
[0002]随着金融行业的快速发展,金融公司涉及到的业务范围越来越宽泛,尤其是在保险理赔中,车险的量级是最大的,因涉及的量巨多,那么其伴随的风险不仅有较大差异,在理赔时,通过理赔案件进行分析判断是否有理赔风险,从而评估能否成功理赔
。
[0003]在目前金融公司内,为了保证理赔模型评估的准确性,常用的做法是大量的引入已经结案的理赔数据进行理赔结果预测,但是,这种方式,往往会导致模型内引入大量的数据,造成模型负载过大,还会导致引入太多无用的或者无代表性的预测特征,造成模型预测结果不准确
。
技术实现思路
[0004]本申请实施例的目的在于提出一种理赔结果预测方法
、
装置
、
设备及其存储介质,以解决现有技术在进行理赔结果预测时,导致模型内引入大量的数据,造成模型负载过大,还会导致引入太多无用的或者无代表性的预测特征,造成模型预测结果不准确的问题
。
[0005]为了解决上述技术问题,本申请实施例提供理赔结果预测方法,采用了如下所述的技术方案:
[0006]一种理赔结果预测方法,包括下述步骤:
[0007]获取已结案的车险理赔数据,其中,所述车险理赔数据对应不同理赔结果类型;
[0 ...
【技术保护点】
【技术特征摘要】
1.
一种理赔结果预测方法,其特征在于,包括下述步骤:获取已结案的车险理赔数据,其中,所述车险理赔数据对应不同理赔结果类型;对每个所述车险理赔数据分别设定第一区别标识;采用凝聚式层次聚类算法对所有车险理赔数据进行聚类,得到聚类完成的聚类簇,其中,每个所述聚类簇分别设置有第二区别标识;根据所述聚类簇评估所有车险理赔数据的聚类效果;根据设定阈值对每个所述聚类簇进行筛选操作,得到每个聚类簇中聚类效果达到所述设定阈值的期望车险理赔数据;根据所述第二区别标识和所述第一区别标识,获取每个聚类簇中所有期望车险理赔数据,构建特征处理集;分别对所述特征处理集进行特征工程,获取每个特征处理集分别包含的聚类特征以及每个所述聚类特征的特征值,并根据理赔结果类型对所述聚类特征和所述特征值进行整理,获得所有理赔结果类型分别对应的聚类特征和特征值;将所有理赔结果类型分别对应的聚类特征和特征值,设置为目标理赔模型的理赔预测特征和参考值,使用所述目标理赔模型进行车险理赔结果预测
。2.
根据权利要求1所述的理赔结果预测方法,其特征在于,所述采用凝聚式层次聚类算法对所有车险理赔数据进行聚类,得到聚类完成的聚类簇的步骤,具体包括:步骤
301
,将所有车险理赔数据都分别作为待聚类簇;步骤
302
,根据预设的相似度函数,计算所有待聚类簇之间的相似度,获得相似度计算结果;步骤
303
,根据所述相似度计算结果,合并相似度最大的两个待聚类簇,获得合并后的聚类簇作为新的待聚类簇,统计待聚类簇的数量;步骤
304
,重复执行步骤
302
至步骤
303
,进行待聚类簇合并和新的待聚类簇生成,直到待聚类簇的数量达到所述目标聚类簇数,则聚类完成,得到所述聚类完成的聚类簇
。3.
根据权利要求2所述的理赔结果预测方法,其特征在于,所述根据预设的相似度函数,计算所有待聚类簇之间的相似度,获得相似度计算结果的步骤,具体包括:采用平均链接函数,计算所有待聚类簇之间的相似度,获得相似度计算结果,其中,所述平均链接函数的计算方式为:述平均链接函数的计算方式为:表示以待聚类簇
C1
和待聚类簇
C2
为函数入参参数,计算所述待聚类簇
C1
和待聚类簇
C2
中所有车险理赔数据间的平均相似度,其中,
C1
表示待聚类簇
C1
,
C2
表示待聚类簇
C2
,
|C1|
表示待聚类簇
C1
中的车险理赔数据条数,
|C2|
表示待聚类簇
C2
中的车险理赔数据条数,
i
表示待聚类簇
C1
中的任一条车险理赔数据,
j
表示待聚类簇
C2
中的任一条车险理赔数据,
sim(i,j)
表示待聚类簇
C1
中的任一条车险理赔数据与待聚类簇
C2
中的任一条车险理赔数据之间的相似度
。4.
根据权利要求1所述的理赔结果预测方法,其特征在于,所述根据所述聚类簇评估所有车险理赔数据的聚类效果的步骤,具体包括:步骤
401,
任意筛选一条车险理赔数据为当前评估数据;步骤
402
,计算所述当前评估数据与同聚类簇中其他车险理赔数据的平均距离,作为第一平均距离;
步骤
403
,通过对比,识别出离所述当前评估数据距离最近的其他聚类簇,作为选定聚类簇;步骤
404
,计算所述当前评估数据与所述选定聚类簇中所有车险理赔数据的平均距离,作为第二平均距离;步骤
405
,通过预设的聚类效果计算公式计算当前评估数据的聚类效果值
,
其中,所述聚类效果计算公式表示为:其中,
k
表示当前聚类簇中第
k
条车险理赔数据,
n
表示当前聚类簇中车险理赔数据的条数,
k
为正整数,
n
为正整数,且
1≤k≤n,a
k
表示所述第一平均距离,
b
k
表示所述第二平均距离,
max(a
k
,b
k
)
为筛选函数,表示从所述第一平均距离和第二平均距离中筛选出较大值;步骤
406
,重新选定当前评估数据,并循环执行步骤
402
至步骤
406
,直到计算出所有车险理赔数据的聚类效果值,终止循环执行
。5.
...
【专利技术属性】
技术研发人员:陈奕宇,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。