车辆保险案件量的预测方法及装置制造方法及图纸

技术编号:23401006 阅读:49 留言:0更新日期:2020-02-22 13:10
本发明专利技术公开一种车辆保险案件量的预测方法及装置,涉及机器学习领域,能够更为准确地预测车辆保险案件量。该方法包括:服务器确定训练集,该训练集包括多个案件量样本数据,该案件量样本数据包括天气特征数据、地理特征数据、时间特征数据、以及案件量特征数据;服务器基于极端梯度提升XGBoost算法构建预测模型,以训练集对预测模型进行训练,该预测模型用于预测车辆保险案件量;服务器根据训练好的预测模型,确定车辆保险案件量的预测值。本发明专利技术适用于预测未来发生案件量的过程中。

Prediction method and device of vehicle insurance cases

【技术实现步骤摘要】
车辆保险案件量的预测方法及装置
本专利技术涉及机器学习领域,尤其涉及一种车辆保险案件量的预测方法及装置。
技术介绍
随着车辆保险行业规模的扩大,车辆保险案件量也随之增大。每当车辆行驶途中出现故障,保险公司会派工作人员进行救援。为了有效地实施救援工作,车辆保险案件量预测的研究成为了保险行业提前规划救援和及时调度的研究重点和热点。通过预测案件量,为保险行业智能调度与成本控制提供依据。目前,传统获取案件量的方法是依据线性方式,采用多项式结合业务经验的方式预测案件量。现有的方法普遍存在预测结果与实际情况偏差很大的情况。因此,如何提高预测案件量的准确率,成为一个亟待解决的问题。
技术实现思路
本专利技术实施例提供一种车辆保险案件量的预测方法及装置,能够提高预测案件量的准确率。为达到上述目的,本专利技术提供如下技术方案:第一方面,提供一种车辆保险案件量的预测方法,包括:服务器确定训练集,该训练集包括多个案件量样本数据,该案件量样本数据包括天气特征数据、地理特征数据、时间特征数据、以及案件量特征数据;天气特征数据用于反映天气特征对于车辆保险案件量的影响;地理特征数据用于反映地理特征对于车辆保险案件量的影响;时间特征数据用于反映时间特征对于车辆保险案件量的影响;案件量特征数据用于反映案件量特征对于车辆保险案件量的影响。服务器以训练集对预测模型进行训练,预测模型用于预测车辆保险案件量,预测模型基于XGBoost算法构建。服务器根据训练好的预测模型,确定预测的车辆保险案件量。基于上述技术方案,车辆保险案件的发生受许多因素(例如地理、天气、节假日)的影响。因此,在进行案件数量预测时,综合考虑案件量本身的规律(也即案件量特征数据)及结合这些外部因素(也即天气特征数据、地理特征数据、时间特征数据),可以有效提升预测模型的准确率;另外,针对不同维度的影响程度进行分析,可以提升预测模型的泛化能力,使得预测模型可以适应不同的场景。另外,本专利技术提供的预测模型是基于XGBoost算法构建的,从而能够很好地控制预测模型的复杂度,防止过拟合。一种可能的设计中,该方法包括:服务器确定测试集,该测试集包括多个案件量样本数据,测试集与训练集之间不存在交集。服务器以测试集对训练好的预测模型进行测试。服务器根据测试结果,评价训练好的预测模型。基于该设计,服务器可以根据测试集对训练好的预测模型进行测试,得到测试结果,从而确定预测案件量的准确率。一种可能的设计中,天气特征数据包括以下一项或多项:当天降水量的平均值、距离上一次下中雨及以上的天数、距离上一次下雨的雨量、当天温度的平均值、与前一天温度的温差;地理特征数据包括以下一项或多项:道路长度、道路面积、道路密度;时间特征数据包括以下一项或多项:距离上一个节假日(除春节外)天数、距离下一个节假日(除春节外)天数、工作日、节假日、月份、季度;案件量特征数据包括以下一项或多项:预测日前n天案件量、预测日前n天内相邻天案件量差的平均值、预测日前n天内案件量的平均值、预测日前n天内案件量的标准差、预测日前n天内案件量的中位数、预测日前n天内工作日的案件量。基于该设计,服务器可以得到每种特征数据中的多个数据。一种可能的设计中,预测模型为普通预测模型或异常预测模型;其中,异常预测模型用于预测异常天气情况下的车辆保险案件量;异常天气情况包括以下一项或多项:暴雨、高温、暴雪;普通预测模型用于预测普通天气情况下的车辆保险案件量;普通天气情况为除了异常天气情况之外的其他天气情况。基于该设计,预测模型分为两种预测模型,可以在不同的天气情况下,针对性地使用预测模型预测案件量,提高预测案件量的准确性。一种可能的设计中,在预测模型为普通预测模型的情况下,训练集为普通训练集,普通训练集所包括的案件量样本数据未经过人工干预;在预测模型为异常预测模型的情况下,训练集为异常训练集,异常训练集所包括的案件量样本数据经过人工干预。基于该设计,对异常训练集进行人工干预,使异常训练集与异常天气情况的数据更贴近,从而使训练出的异常预测模型得到的预测数据更加准确,提高预测案件的准确率。第二方面,提供一种服务器,该服务器包括:确定模块,用于确定训练集,该训练集包括多个案件量样本数据,该案件量样本数据包括天气特征数据、地理特征数据、时间特征数据、以及案件量特征数据;天气特征数据用于反映天气特征对于车辆保险案件量的影响;地理特征数据用于反映地理特征对于车辆保险案件量的影响;时间特征数据用于反映时间特征对于车辆保险案件量的影响;案件量特征数据用于反映案件量特征对于车辆保险案件量的影响。处理模块,用于以训练集对预测模型进行训练,预测模型用于预测车辆保险案件量,预测模型基于XGBoost算法构建。确定模块,还用于根据训练好的预测模型,确定预测的车辆保险案件量。一种可能的设计中,确定模块,还用于确定测试集,该测试集包括多个案件量样本数据,测试集与训练集之间不存在交集。处理模块,还用于以测试集对训练好的预测模型进行测试。确定模块,还用于根据测试结果,评价训练好的预测模型。一种可能的设计中,天气特征数据包括以下一项或多项:当天降水量的平均值、距离上一次下中雨及以上的天数、距离上一次下雨的雨量、当天温度的平均值、与前一天温度的温差;地理特征数据包括以下一项或多项:道路长度、道路面积、道路密度;时间特征数据包括以下一项或多项:距离上一个节假日(除春节外)天数、距离下一个节假日(除春节外)天数、工作日、节假日、月份、季度;案件量特征数据包括以下一项或多项:预测日前n天案件量、预测日前n天内相邻天案件量差的平均值、预测日前n天内案件量的平均值、预测日前n天内案件量的标准差、预测日前n天内案件量的中位数、预测日前n天内工作日的案件量。一种可能的设计中,预测模型为普通预测模型或异常预测模型;其中,异常预测模型用于预测异常天气情况下的车辆保险案件量;异常天气情况包括以下一项或多项:暴雨、高温、暴雪;普通预测模型用于预测普通天气情况下的车辆保险案件量;普通天气情况为除了异常天气情况之外的其他天气情况。一种可能的设计中,在预测模型为普通预测模型的情况下,训练集为普通训练集,普通训练集所包括的案件量样本数据未经过人工干预;在预测模型为异常预测模型的情况下,训练集为异常训练集,异常训练集所包括的案件量样本数据经过人工干预。第三方面,本专利技术提供了服务器,该服务器包括:处理器和通信接口;通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的车辆保险案件量的预测方法。第四方面,本专利技术提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端上运行时,使得终端执行如第一方面和第一方面的任一种可能的实现方式中描述的车辆保险案件量的预测方法。第五方面,本专利技术实施例提供一种包含指令的计算机程序产品,当计算机程序产品在服务器上运行时,使得服务器执行如第一方面和第一方面的任一种可能的实现方式中所描述的车辆保险案件量的预测方法。第六方面,本专利技术实施例提供一种芯本文档来自技高网...

【技术保护点】
1.一种车辆保险案件量的预测方法,其特征在于,所述方法包括:/n确定训练集,所述训练集包括多个案件量样本数据,所述案件量样本数据包括天气特征数据、地理特征数据、时间特征数据、以及案件量特征数据;所述天气特征数据用于反映天气特征对于车辆保险案件量的影响;所述地理特征数据用于反映地理特征对于车辆保险案件量的影响;所述时间特征数据用于反映时间特征对于车辆保险案件量的影响;所述案件量特征数据用于反映案件量特征对于车辆保险案件量的影响;/n以所述训练集对预测模型进行训练,所述预测模型用于预测车辆保险案件量,所述预测模型基于极端梯度提升XGBoost算法构建;/n根据训练好的预测模型,确定车辆保险案件量的预测值。/n

【技术特征摘要】
1.一种车辆保险案件量的预测方法,其特征在于,所述方法包括:
确定训练集,所述训练集包括多个案件量样本数据,所述案件量样本数据包括天气特征数据、地理特征数据、时间特征数据、以及案件量特征数据;所述天气特征数据用于反映天气特征对于车辆保险案件量的影响;所述地理特征数据用于反映地理特征对于车辆保险案件量的影响;所述时间特征数据用于反映时间特征对于车辆保险案件量的影响;所述案件量特征数据用于反映案件量特征对于车辆保险案件量的影响;
以所述训练集对预测模型进行训练,所述预测模型用于预测车辆保险案件量,所述预测模型基于极端梯度提升XGBoost算法构建;
根据训练好的预测模型,确定车辆保险案件量的预测值。


2.根据权利要求1所述的车辆保险案件量的预测方法,其特征在于,所述方法包括:
确定测试集,所述测试集包括多个案件量样本数据,所述测试集与所述训练集之间不存在交集;
以所述测试集对所述训练好的预测模型进行测试;
根据测试结果,评价所述训练好的预测模型。


3.根据权利要求1或2所述的车辆保险案件量的预测方法,其特征在于,
所述天气特征数据包括以下一项或多项:当天降水量的平均值、距离上一次下中雨及以上的天数、距离上一次下雨的雨量、当天温度的平均值、与前一天温度的温差;
所述地理特征数据包括以下一项或多项:道路长度、道路面积、道路密度;
所述时间特征数据包括以下一项或多项:距离上一个节假日(除春节外)天数、距离下一个节假日(除春节外)天数、工作日、节假日、月份、季度;
所述案件量特征数据包括以下一项或多项:预测日前n天案件量、预测日前n天内相邻天案件量差的平均值、预测日前n天内案件量的平均值、预测日前n天内案件量的标准差、预测日前n天内案件量的中位数、预测日前n天内工作日的案件量。


4.根据权利要求3所述的车辆保险案件量的预测方法,其特征在于,所述预测模型为普通预测模型或异常预测模型;
其中,所述异常预测模型用于预测异常天气情况下的车辆保险案件量;所述异常天气情况包括以下一项或多项:暴雨、高温、以及暴雪;
所述普通预测模型用于预测普通天气情况下的车辆保险案件量;所述普通天气情况为除了所述异常天气情况之外的其他天气情况。


5.根据权利要求4所述的车辆保险案件量的预测方法,其特征在于,
在所述预测模型为普通预测模型的情况下,所述训练集为普通训练集,所述普通训练集所包括的案件量样本数据未经过人工干预;
在所述预测模型为异常预测模型的情况下,所述训练集为异常训练集,所述异常训练集所包括的案件量样本数据经过人工干预。


6.一种服务器,其特征在于,所述服务器包括:
确定模块,用于确定训练集,所述训练集包括多个案件量样本数据,所述案件量样本数据包括天气特征数据、地理特征数据、时间特征数据、以及案件量特征数...

【专利技术属性】
技术研发人员:麻雪丽马宇岩陈驭龙
申请(专利权)人:北京世纪高通科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1