一种理赔风险评估方法、装置及服务器制造方法及图纸

技术编号:20243575 阅读:45 留言:0更新日期:2019-01-29 23:40
本申请实施例提供一种理赔风险评估方法、装置及服务器,通过利用待估用户的多种行为数据,经预处理得到第一数量维度的初始特征数据,利用特征选择算法对其进行特征筛选,得到第二数量维度的特征变量,并将其划分成第三数量类型的特征集,从而利用机器学习算法,对这第三数量类型的特征集包含的特征变量进行计算,确定待估用户的目标赔付率。由此可见,本申请在预测用户的赔付风险时,充分考虑了待估用户各方面对理赔风险的影响,得到成千上万的预测模型输入变量,降低了个别输入变量扰动对预测结果的干扰,提高了用户赔付风险评估的准确性以及稳定性,以便业务人员针对待估用户指定合理且可靠的投保与理赔方案。

【技术实现步骤摘要】
一种理赔风险评估方法、装置及服务器
本申请涉及保险应用领域,具体涉及一种理赔风险评估方法、装置及处理服务器。
技术介绍
改革开放以来,随着我国保险业不断发展壮大,保险在经济社会中发挥的功能和作用越来越突出,尤其是汽车保险(简称车险)在30多年间更得到了迅速发展,为经济社会发展和人民生活稳定提供了重要保障。然而,近些年行业综合成本率居高不下,车险的发展理念逐渐从“销售为王”向“精细管理”转变。而且,目前行业内常用的车险费率模型中,用于定价的数据维度通常都比较少,从而使车主的个性化风险定价空间有限,好车主和坏车主的车险费差别不大,非常不公平。对此,行业提出了基于UBI车险(UsageBasedInsurance,基于驾驶行为而定保费的保险)定价的商业模式,也就是说,基于用户驾驶时间、驾驶行为习惯、驾驶路径、驾驶频率以及车辆的车辆购置价、车型、座位数以及厂商等从车因子,预测用户的赔付风险(通常指赔付率),从而根据用户的预测赔付率大小,来确定用户车辆的保费。申请人发现,如今绝大部分的交通事故是人为引起的,而现有的预测用户赔付率的模型的输入变量多为从车因子,且从车因子的权重最大,导致传统预测模型输出的预测赔付率准确性较低,往往会使大部分优质的车险用户,为少数因恶劣的驾驶行为造成高额理赔的用户买单。由此可见,如何使投保人的车险保费设定更加合理成为本领域研究重点。
技术实现思路
有鉴于此,本申请实施例提供一种理赔风险评估方法、装置及服务器,解决了现有技术无法针对不同投保人特点,合理设定车险保费的技术问题。为了解决上述技术问题,本申请提出了以下技术方案:本申请实施例提供了一种理赔风险评估方法,所述方法包括:获取待估用户的行为数据;对所述待估用户的行为数据进行预处理,得到第一数量维度的初始特征数据;利用特征选择算法,对所述第一数量维度的初始特征数据进行特征筛选,得到第二数量维度的特征变量,所述第二数量不大于所述第一数量;将所述第二数量维度的特征变量划分成不同类型的第三数量特征集,每个类型的特征集包含有多个维度的特征变量,所述第三数量小于所述第二数量;利用机器学习算法,对所述第三数量特征集各自包含的特征变量进行计算,确定所述待估用户的目标赔付率。本申请实施例提供了还一种理赔风险评估装置,所述装置包括:数据获取模块,用于获取待估用户的行为数据;预处理模块,用于对所述待估用户的行为数据进行预处理,得到第一数量维度的初始特征数据;特征处理模块,用于利用特征选择算法,对所述第一数量维度的初始特征数据进行特征筛选,得到第二数量维度的特征变量,所述第二数量不大于所述第一数量;分组模块,用于将所述第二数量维度的特征变量划分成不同类型的第三数量特征集,每个类型的特征集包含有多个维度的特征变量,所述第三数量小于所述第二数量;计算模块,用于利用机器学习算法,对所述第三数量特征集各自包含的特征变量进行计算,确定所述待估用户的目标赔付率。本申请实施例提供了还一种服务器,所述服务器包括:通信端口;存储器,用于实现如上所述的理赔风险评估方法的多个指令;处理器,用于加载并执行所述多个指令,包括:获取待估用户的行为数据;对所述待估用户的行为数据进行预处理,得到第一数量维度的初始特征数据;利用特征选择算法,对所述第一数量维度的初始特征数据进行特征筛选,得到第二数量维度的特征变量,所述第二数量不大于所述第一数量;将所述第二数量维度的特征变量划分成不同类型的第三数量特征集,每个类型的特征集包含有多个维度的特征变量,所述第三数量小于所述第二数量;利用机器学习算法,对所述第三数量特征集各自包含的特征变量进行计算,确定所述待估用户的目标赔付率。基于上述技术方案,本申请实施例中,当用户(即为待估用户)进行车险投保时,业务人员可以先对该待估用户理赔风险进行一下评价,以便指定合理的投保与理赔方案,具体可以通过多个用户行为数据源,获得待估用户的多种行为数据,通过对这些行为数据进行预处理,得到第一数量维度的初始特征数据,之后,利用特征选择算法,对这第一数量维度的初始特征数据进行特征筛选,得到第二数量维度的特征变量,并将其划分成第三数量类型的特征集,从而利用机器学习算法,对这第三数量类型的特征集包含的特征变量进行计算,确定待估用户的目标赔付率。由此可见,本申请在预测用户的赔付风险时,充分考虑了待估用户各方面对理赔风险的影响,得到成千上万的预测模型输入变量,降低了个别输入变量扰动对预测结果的干扰,提高了用户赔付风险评估的准确性以及稳定性,以便业务人员针对待估用户指定合理且可靠的投保与理赔方案。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的一种理赔风险评估系统的架构示意图;图2为本申请实施例提供的一种服务器硬件结构图;图3为本申请实施例提供的一种理赔风险评估方法的流程图;图4为本申请实施例提供的另一种理赔风险评估方法的部分流程图;图5为本申请实施例提供的又一种理赔风险评估方法的部分流程图;图6为本申请实施例提供的一种理赔风险评估方法的系统流程示意图;图7为本申请实施例提供的一种理赔风险评估装置的结构框图;图8为本申请实施例提供的另一种理赔风险评估装置的部分结构框图;图9为本申请实施例提供的又一种理赔风险评估装置的部分结构框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。结合
技术介绍
部分的分析,传统预测模型的输入多选用车辆相关的变量,很少考虑与车主自身及其行为相关的影响理赔风险的因素,即从人因子,即便考虑也仅仅是性别、年龄等一些基本特征,对车主的刻画很少,导致得到的预测赔付率的精准度较低,并不能满足如今大部分出险由人引起的场景需要。而且,传统预测模型仅依靠几个或十几个变量,抗干扰能力差,对获取的模型输入数据质量要求较高,使得模型应用有很大局限性。随着大数据时代的到来和快速发展,各种各样的用户数据都可以用于转化、评估、体验用户车险赔付的风险,所以,申请人提出,除了传统预测模型输入的车辆和地区数据外,将利用金融数据、电商数据、通讯数据、社交数据等不同类型数据构成的大数据,实现车辆理赔风险的评估。然而,在本行业中,受大数据发展的引导,通常只能想到结合车联网实现车险理赔风险的评估,而该车联网得到的数据通常是用户对车辆的驾驶行为数据,从而在驾驶行为分析研究的基础上,给出车险预测模型和UBI车险定价策略,并不会想到结合上述列举的如利用金融数据、电商数据、通讯数据、社交数据等与驾驶行为无关的数据,更何况如何将各种复杂异构的数据,整合在一起构建有效的预测模型也是本领域未曾研究的课题。所以说,相对于现有技术利用传统预测模型评估理赔风险的方法,本申请提出的在预测模型中输入大量从人因子,如用户在移动社交移动软件上的各种线上线下行为数据本文档来自技高网
...

【技术保护点】
1.一种理赔风险评估方法,其特征在于,所述方法包括:获取待估用户的行为数据;对所述待估用户的行为数据进行预处理,得到第一数量维度的初始特征数据;利用特征选择算法,对所述第一数量维度的初始特征数据进行特征筛选,得到第二数量维度的特征变量,所述第二数量不大于所述第一数量;将所述第二数量维度的特征变量划分成不同类型的第三数量特征集,每个类型的特征集包含有多个维度的特征变量,所述第三数量小于所述第二数量;利用机器学习算法,对所述第三数量特征集各自包含的特征变量进行计算,确定所述待估用户的目标赔付率。

【技术特征摘要】
1.一种理赔风险评估方法,其特征在于,所述方法包括:获取待估用户的行为数据;对所述待估用户的行为数据进行预处理,得到第一数量维度的初始特征数据;利用特征选择算法,对所述第一数量维度的初始特征数据进行特征筛选,得到第二数量维度的特征变量,所述第二数量不大于所述第一数量;将所述第二数量维度的特征变量划分成不同类型的第三数量特征集,每个类型的特征集包含有多个维度的特征变量,所述第三数量小于所述第二数量;利用机器学习算法,对所述第三数量特征集各自包含的特征变量进行计算,确定所述待估用户的目标赔付率。2.根据权利要求1所述的方法,其特征在于,所述利用特征选择算法,对所述第一数量类型的初始特征数据进行特征筛选,得到第二数量类型的特征变量,包括:对所述第一数量维度的初始特征数据进行特征迭代,筛选出满足预设要求的初始特征数据构成候选特征子集;对所述候选特征子集中的初始特征数据进行特征分类,生成相应的衍生特征数据,对本次迭代后的初始特征数据继续进行特征迭代,直至特征迭代次数达到第一阈值;利用所述候选特征子集中的初始特征数据以及生成的衍生特征数据,确定第二数量维度的特征变量。3.根据权利要求1所述的方法,其特征在于,所述利用机器学习算法,对所述第三数量特征集各自包含的特征变量进行计算,确定所述待估用户的目标赔付率,包括:对第三数量特征集各自包含的特征变量进行相应模型训练,得到第三数量预测赔付率;利用线性回归算法,对所述第三数量预测赔付率进行计算,获得所述待估用户的目标赔付率。4.根据权利要求3所述的方法,其特征在于,所述对第三数量特征集包含的特征变量进行相应模型训练,得到第三数量预测赔付率,包括:对第三数量特征集各自包含的多个维度的特征变量进行可放回抽样;利用每次可放回抽样所得到的特征变量,构建对应的决策树;计算所述待估用户在各决策树上命中节点的第一赔付率;对计算得到的第四数量第一赔付率进行数学变换,确定第四数量第一输入变量;利用机器学习算法对所述第四数量第一输入变量的进行模型训练,得到相应的预测赔付率。5.根据权利要求3所述的方法,其特征在于,所述利用线性回归算法,对所述第三数量的预测赔付率进行计算,获得所述用户的目标赔付率,包括:对所述第三数量预测赔付率进行数学变换,确定用于预测待估用户目标赔付率的预测模型的第三数量第二输入变量;利用线性回归算法对所述第三数量输入变量进行模型训练,得到所述待估用户的目标赔付率。6.根据权利要求1-5任意一项所述的方法,其特征在于,所述方法还包括:确定所述目标赔付率小于预设赔付率阈值,选择与所述目标赔付率对应的投保与理赔方案;将确定所述投保与理赔方案发送至客户端。7.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取多个样本用户在构建的各决策树上命中节点的赔付总金额以及总保费;利用所述赔付总金额以及所述总保费,计算得到基础赔付率;所述对计算得到的第四数量第一赔付率进行数学变换,确定第四数量第一输入变量,包括:利用所述基础赔付率,对计算得到的第四数量第一赔付率进行数学变换,得到第四数量第一输入变量。8.根据权利要求2所述的方法,其特征在于,所述对所述候选特征子集中的初始特征数据进行特征分类,生成相应的衍生特征数据,包括:利用所述候选特征子集包含的不同类型的初始特征数据,生成相应的第一衍生特征数据;利用所述候选特征子集包含的初始特征数据,确定所述待...

【专利技术属性】
技术研发人员:陈培炫段培陈玲陈谦
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1