一种基于GLM及机器学习算法的车险纯风险保费预测方法及装置制造方法及图纸

技术编号：36252170 阅读：18 留言：0更新日期：2023-01-07 09:45

本申请提供一种基于GLM及机器学习算法的车险纯风险保费预测方法及装置，包括：采集第一建模因子的第一定价数据形成第一模型样本集，使用第一模型样本集拟合第一层GLM模型，计算预测结果残差；在第一定价数据的基础上，采集第二建模因子；将第二建模因子的定价数据关联至第一定价数据，形成第二定价数据，并将第二定价数据作为第二模型样本集，将第二模型样本集进行处理后拟合第二层XGBoost残差模型，并将残差的预测结果进行切分，切分后的每组数据作为梯度提升分因子；将梯度提升分因子、第三定价数据作为第三模型样本集拟合第三层GLM模型，计算并输出纯风险保费预测值。本发明专利技术结合了传统的GML模型与XGBoost模型，具有可解释性、可控性、预测性能更强的优点。预测性能更强的优点。预测性能更强的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GLM及机器学习算法的车险纯风险保费预测方法及装置

[0001]本专利技术涉及数据处理领域，特别涉及一种基于GLM及机器学习算法的车险纯风险保费预测方法及装置。

技术介绍

[0002]车险精算定价模型是保险公司管理和控制承保风险最重要的工具。在车险业务实际应用中，对精算定价模型的要求有两个：一是预测的准确性，二是模型的可解释性与可控性。在当前落地应用的模型中，这两者很难兼顾。
[0003]传统车险精算定价采用以广义线性模型(GLM)为主的概率统计模型。传统GLM模型可解释性强、可控性高，可以为业务实践提供足够的安全感。然而，由于传统GLM模型只能拟合因子和目标间的线性关系，无法获取非线性的部分和因子间的交互对目标的影响，因此往往预测准确性有限。
[0004]随着人工智能、机器学习算法的兴起，保险领域也开始使用各种机器学习模型来预测纯风险保费。机器学习模型有强大的非线性表达能力，非寿险精算定价相关研究已经证明机器学习算法可以显著提升车险精算定价模型的预测准确性。然而，由于机器学习算法的可解释性和可控性远低于传统GLM模型，尽管有着卓越的预测性能，这些模型却始终难以落地。

技术实现思路

[0005]本专利技术的目的是提供一种达到既具有可解释性与可控性，又能达到较好的预测效果的基于GLM及机器学习算法的车险纯风险保费预测方法及装置。
[0006]为了实现上述目的，本申请实施例采用如下技术方案：
[0007]第一方面，本申请实施例提供了一种基于GLM及机器学习算法的车险...

【技术保护点】

【技术特征摘要】
1.一种基于GLM及机器学习算法的车险纯风险保费预测方法，其特征在于，包括：步骤S1：采集第一建模因子的第一定价数据形成第一模型样本集，使用所述第一模型样本集拟合第一层GLM模型，计算预测结果残差；步骤S2：在所述第一定价数据的基础上，采集第二建模因子；将所述第二建模因子的定价数据关联至所述第一定价数据，形成第二定价数据，并将第二定价数据作为第二模型样本集，将所述第二模型样本集进行处理后拟合第二层XGBoost残差模型，并将残差的预测结果进行切分，切分后的每组数据作为梯度提升分因子；步骤S3：将所述梯度提升分因子、第三定价数据作为第三模型样本集拟合第三层GLM模型，计算并输出纯风险保费预测值。2.根据权利要求1所述的基于GLM及机器学习算法的车险纯风险保费预测方法，其特征在于，所述步骤S1包括：S11：采集第一建模因子的第一定价数据和对应的第一纯风险保费形成第一模型样本集；其中所述第一建模因子包含从车信息、从人信息、平台信息、保单信息；S12:对所述第一模型样本集进行预处理，生成符合GLM模型要求的第一样本数据；S13：使用所述第一样本数据拟合第一层GLM模型；S14:在第一层GLM模型中输入所述第一定价数据，处理后，输出第一纯风险保费预测值；S15:通过所述纯风险保费预测值计算预测结果残差；所述第一预测结果残差＝纯风险保费实际值
‑
纯风险保费预测值。3.根据权利要求1或2所述的基于GLM及机器学习算法的车险纯风险保费预测方法，其特征在于，所述步骤S2包括：S21：在所述第一定价数据的基础上，采集第二建模因子；将所述第二建模因子的定价数据关联至所述第一定价数据，形成第二定价数据，并将第二定价数据作为第二模型样本集；其中第二建模因子包含从车信息、从人信息、平台信息、保单信息、高维从车信息；S22：对所述第二模型样本集进行预处理，生成符合XGBoost残差模型的第二样本数据；S23：使用分层随机抽样的方法将所述第二定价数据与第一预测结果残差划分为训练集、验证集和测试集；所述训练集、验证集和测试集划分比例为6：2：2；S24：使用所述训练集数据拟合XGBoost残差模型，使用所述验证集数据调整XGBoost残差模型训练过程中的超参，使用所述测...

【专利技术属性】
技术研发人员：赵昕，
申请(专利权)人：上海七炅信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人