理赔风险预测方法、系统、设备及存储介质技术方案

技术编号:18785015 阅读:39 留言:0更新日期:2018-08-29 07:24
本发明专利技术涉及一种理赔风险预测方法、系统、设备和储存介质,在客户提交订单后,计算出该订单的理赔风险指数,该方法包括如下步骤:获取订单基本特征;计算基于基本特征的衍生特征;根据基本特征获取对应的收、寄件人的历史理赔数据;将基本特征、衍生特征及历史理赔数据进行融合处理并输入预先基于XGBOOST算法构建的风险预测模型,得到理赔风险指数。通过使用XGBOOST算法进行建模,对订单数据信息进行综合评判,能够在客户下单后,订单成交之前计算出该订单的理赔风险指数,从而预先针对理赔风险指数高的订单做出相应的预防措施,降低损失。

【技术实现步骤摘要】
理赔风险预测方法、系统、设备及存储介质
本专利技术涉及风险预测
,尤其适合物流领域的理赔风险预测。
技术介绍
随着互联网、物流、运输等行业的发展,越来越多的人选择网络购物,或者利用快递公司来进行物品邮寄。每天产生的大量快件中,一些少数快件由于自身物品的特殊性,或者在运输环节、派送环节等由于某些原因,或者由于客户自身的特殊情况等,而产生不同程度的损坏,这就会产生对这些快件进行理赔,对客户和快递公司都会造成不同程度的损失。现有技术中,很难做到提前甄别快件的理赔风险,因此,需要一种理赔风险预测方法,在客户下单后、收派员上门取件之前计算出该快件的理赔风险指数。
技术实现思路
为了能够在客户下单后、订单成交之前计算出订单的理赔风险指数,本专利技术提供了一种基于XGBOOST算法对订单的理赔风险进行计算的预测方法、系统、设备及存储介质。本专利技术涉及一种理赔风险预测方法,包括如下步骤:获取订单基本特征;计算基于基本特征的衍生特征;根据基本特征获取对应的收、寄件人的历史理赔数据;将基本特征、衍生特征及历史理赔数据进行融合处理并输入预先基于XGBOOST算法构建的风险预测模型,得到理赔风险指数。优选地,基本特征包括寄件人、收件人,寄件地址,收件地址,托寄物类型及时效信息。优选地,衍生特征包括收、寄件地址距离,关联收、寄件区域历史理赔率中至少一项。优选地,历史理赔数据包理赔次数,寄件次数,保价频率及地址变更次数中至少一项。优选地,所述将基本特征、衍生特征及历史理赔数据融合处理,包括将基本特征、衍生特征及历史理赔数据直接组合为一个特征向量。优选地,风险预测模型是通过将包括基本特征、衍生特征及历史理赔数据的历史订单数据集作为XGBOOST算法的输入,构建的风险预测模型,其中,历史订单数据集是对历史的快递订单统计得到的数据集合。优选地,本专利技术的理赔风险预测方法还包括在预设时间内将理赔风险指数推送至收派终端。优选地,预设时间内包括在订单触发之后至揽收之前。优选地,本专利技术的理赔风险预测方法,还包括反馈针对高风险理赔托寄物的揽收策略。本专利技术还涉及一种理赔风险预测系统,包括基本特征获取模块,配置用于获取订单基本特征;衍生特征获取模块,配置用于计算基于基本特征的衍生特征;理赔数据获取模块,配置用于获取基于基本特征对应的收、寄件人的历史理赔数据;风险预测模块,配置用于将基本特征、衍生特征及历史理赔数据进行融合处理并输入预先基于XGBOOST算法构建的风险预测模型,得到理赔风险指数。本专利技术还涉及一种设备,该设备包括:一个或多个处理器;存储器,其上存储有一个或多个程序;当一个或多个处理器执行一个或多个程序时,实现上述的理赔风险预测方法的步骤。本专利技术还涉及一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的理赔风险预测方法的步骤。本专利技术的理赔风险预测方法、系统、设备及存储介质,通过使用XGBOOST算法进行建模,对订单数据信息进行综合评判,能够在客户下单后,订单成交之前计算出该订单的理赔风险指数,从而预先针对理赔风险指数高的订单做出相应的预防措施,降低损失。附图说明下面参考附图描述本专利技术的优选实施例,附图为了说明本专利技术的优选实施例而不是为了限制本专利技术的目的。附图中,图1为本专利技术实施例的总体流程框图。图2为本专利技术实施例的基于XGBOOST算法构建理赔风险预测模型的流程图。具体实施方式本专利技术的具体实施方式用来具体说明本专利技术,但并不局限于该具体实施方式。以下实施例中以快递订单为例对本专利技术进行具体说明。图1为本专利技术实施例的总体流程框图。如图1所示,本实施例的理赔风险预测方法,包括如下步骤:步骤S1:获取订单基本特征;从收件系统中获取客户快递订单的数据,快递订单数据是以json格式表达的,包括了和快递运单相关的各种信息。当客户下单后,从该订单的json字符串中解析并提取需要的字段以及对应的字段值,得到该订单的基本特征。获取的基本特征包括寄件人、收件人、寄件地址、收件地址、托寄物类型、和时效信息等。步骤S2:计算基于基本特征的衍生特征。根据步骤S1中获得的基本特征实时计算该订单相关的衍生特征。衍生特征为根据该订单的基本特征进行相关计算得到的特征,例如:寄件地址和收件地址的物理距离、以及和收件地和寄件地相关的历史理赔率映射等。历史理赔率映射是指根据当前运单的区域编号查找其对应的历史理赔率。历史理赔率是根据过往的历史理赔数据对不同地区对应的理赔率做统计并保存得到的。步骤S3:根据基本特征获取对应的收、寄件人的历史理赔数据。根据步骤S1中获取的基本特征信息,实时查询并得到寄件人和收件人的历史理赔数据,包括理赔次数、寄件次数、地址变更次数等。步骤S4:将基本特征、衍生特征及历史理赔数据进行融合处理并输入预先基于XGBOOST算法构建的风险预测模型,得到理赔风险指数。将步骤S1得到的订单的基本特征、步骤S2得到的衍生特征和步骤3中得到的历史理赔数据进行融合处理,其处理的方式可以将以上特征直接组合为一个更大维度的特征向量。例如:基本特征有a维,衍生特征有b维,历史理赔数据有c维,那么,直接将基本特征、衍生特征和历史理赔数据组合成为一个维数为a+b+c的特征向量T。下面来详细说明本专利技术实施例构建风险预测模型的方法。图2为本实施例基于XGBOOST算法构建风险预测模型的流程图。风险预测模型是通过将包括基本特征、衍生特征及历史理赔数据的历史订单数据集作为XGBOOST算法的输入,构建的风险预测模型,其中,历史订单数据集是对历史的快递订单统计得到的数据集合。构建风险预测模型,就是根据历史订单数据集通过XGBOOST算法的训练过程。如图2所示,构建风险预测模型包括如下方法:步骤S41,提取并采样历史快递订单数据集作为训练集合。历史快递订单数据集是指历史所产生的所有快递订单的单据数据,包括理赔订单和非理赔订单。例如,对非理赔订单进行随机采样,使得最终训练集合中理赔订单和非理赔订单数相比约为1:10。步骤S42,构建特征集合。各历史快递订单的数据由特征集来表达。在提取了历史快递订单数据集作为训练集合后,提取训练集合中的每个历史订单的特征向量,该特征向量即通过将该历史订单的基本特征、衍生特征和历史理赔数据进行融合处理得到。将提取的所有历史订单数据集的特征向量组成特征集合。在特征集合中的不同特征具有不同的数据类别数目,例如,寄件区域代码的数据类别数目就是指所有的地区区域代码。步骤S43,XGBOOST模型训练。利用步骤S41的训练集合,步骤S42的特征集合,通过XGBOOST算法训练出理赔风险预测模型。XGBOOST算法由回归树组成,每个回归树包括多个叶子节点,每个叶子节点均对应一个得分,回归树将所述训练集合分配到各叶子节点。回归树根据输入的特征将所述历史订单的训练集合分配到各叶子节点,输入的特征为训练集合的特征集中一个特征。XGBOOST算法的结果就是所有回归树值叠加到一起作为最终的预测值。XGBOOST算法是对训练集合有标签的学习。比如,我们通过对历史快递订单大数据信息中提取了10万条历史订单数据,每个历史快递订单都有50个特征构成的特征集和一个标签,此处的标签为理赔高风险、理赔中等风险和理赔低风险,如果规约为数值2、1和0,那么理赔高风险的快递订单的本文档来自技高网...

【技术保护点】
1.一种理赔风险预测方法,其特征在于,包括如下步骤获取订单基本特征;计算基于基本特征的衍生特征;根据基本特征获取对应的收、寄件人的历史理赔数据;将基本特征、衍生特征及历史理赔数据进行融合处理并输入预先基于XGBOOST算法构建的风险预测模型,得到理赔风险指数。

【技术特征摘要】
1.一种理赔风险预测方法,其特征在于,包括如下步骤获取订单基本特征;计算基于基本特征的衍生特征;根据基本特征获取对应的收、寄件人的历史理赔数据;将基本特征、衍生特征及历史理赔数据进行融合处理并输入预先基于XGBOOST算法构建的风险预测模型,得到理赔风险指数。2.根据权利要求1所述的理赔风险预测方法,其特征在于,所述基本特征包括寄件人、收件人,寄件地址,收件地址,托寄物类型及时效信息。3.根据权利要求1所述的理赔风险预测方法,其特征在于,所述衍生特征包括收、寄件地址距离,关联收、寄件区域历史理赔率中至少一项。4.根据权利要求1所述的理赔风险预测方法,其特征在于,所述历史理赔数据包理赔次数,寄件次数,保价频率及地址变更次数中至少一项。5.根据权利要求1所述的理赔风险预测方法,其特征在于,所述将基本特征、衍生特征及历史理赔数据融合处理,包括将基本特征、衍生特征及历史理赔数据直接组合为一个特征向量。6.根据权利要求1所述的理赔风险预测方法,其特征在于,所述风险预测模型是通过将包括基本特征、衍生特征及历史理赔数据的历史订单数据集作为XGBOOST算法的输入,构建的风险预测模型,其中,所述历史订...

【专利技术属性】
技术研发人员:苏丹罗嘉濠唐诗睿高磊张玉双黄则鸣刘志欣
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1