【技术实现步骤摘要】
基于深度Q学习优化理赔预测模型的方法及其相关设备
[0001]本申请涉及模型优化
,尤其涉及一种基于深度Q学习优化理赔预测模型的方法及其相关设备。
技术介绍
[0002]企业的投保理赔往往是最难以评估的,因涉及金额教庞大,同时因企业投保更多是依赖双方的关系,因此理赔拒赔涉及到的后续利益牵扯也是非常庞大的。致使,在保险的各条业务线里,环境最复杂的也莫过于团体了。在保险公司中,当涉及到企业的拒保、拒赔时都需要格外谨慎。也是因为如此拒保和拒赔、黑名单的划定多数是针对清亏、等状况,由于数据过于分散,很难因为案件本身去判断,导致难以从历史案件中去归纳总结或复用到后续理赔中。
[0003]为了解决上述问题,现有技术采用变量增益算法与广度层内增益算法的保险数据决策树构建方法有效提高建模精准度,提升操作便利性。虽然,该种方式能够一定程度上提高建模的精准度,但是,往往又因为理赔各个业务流程的局限性导致模型的分类存在一定的局限性。因此,如何在克服理赔各个业务流程的局限性基础上,训练出更加准确的理赔预测模型成为了亟需解决的问题。r/>
技术实现思路
<本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于深度Q学习优化理赔预测模型的方法,其特征在于,包括下述步骤:获取目标理赔预测模型中的各个预测节点及相邻层级预测节点间的上下级关系;根据相邻层级预测节点间的上下级关系对所述各个预测节点进行区别编号,将所述区别编号设置为状态码;获取预先基于所述各个预测节点而设定的预测环境信息;任选一组目标预测环境信息和状态码作为初始环境信息和初始状态;将所述初始环境信息、初始状态和预设的期望回报值作为配置参数配置给所述目标理赔预测模型;获取批量开放的理赔数据集;将所述理赔数据集输入配置完成的目标理赔预测模型,进行模型优化训练。2.根据权利要求1所述的基于深度Q学习优化理赔预测模型的方法,其特征在于,所述获取目标理赔预测模型中的各个预测节点及相邻层级预测节点间的上下级关系的步骤,具体包括:根据所述目标理赔预测模型的执行流程程序,输出理赔预测模型执行流程图;基于所述理赔预测模型执行流程图,获取各个执行流程节点作为各个预测节点;根据所述理赔预测模型执行流程图,识别相邻层级预测节点间的上下级关系。3.根据权利要求2所述的基于深度Q学习优化理赔预测模型的方法,其特征在于,所述根据相邻层级预测节点间的上下级关系对所述各个预测节点进行区别编号,将所述区别编号设置为状态码的步骤,具体包括:根据所述理赔预测模型执行流程图,从根预测节点开始依次对所述各个预测节点进行区别编号,其中,所述从根预测节点开始依次对所述各个预测节点进行区别编号的步骤,具体包括:基于相邻层级预测节点间的上下级关系,采用递增阿拉伯数字对不同层级间的预测节点进行层级编号;对相同层级间的不同预测节点,采用区别标识进行同层区别编号;依次拼接当前预测节点对应的所述层级编号和所述同层区别编号,将拼接结果设置为所述当前预测节点的状态码。4.根据权利要求3所述的基于深度Q学习优化理赔预测模型的方法,其特征在于,在执行所述对相同层级间的不同预测节点,采用区别标识进行同层区别编号的步骤之前,所述方法还包括:统计当前层级中不同预测节点的数量;若所述当前层级中不同预测节点的数量唯一,则为所述当前层级中唯一预测节点设置期望分值,其中,所述当前层级中唯一预测节点的期望分值为100;若所述当前层级中不同预测节点的数量不唯一,则分别为所述当前层级中不同预测节点设置期望分值,其中,所述当前层级中不同预测节点的期望分值总和为100。5.根据权利要求1所述的基于深度Q学习优化理赔预测模型的方法,其特征在于,在执行所述获取批量开放的理赔数据集的步骤之后,所述方法还包括:预先根据是否拒赔将所述理赔数据集划分为正反数据集;对所述正反数据集进行区别编号,其中,所述区别编号的步骤,具体包括:对正反数据集进行数据集区别编号;对正反数据集内不同理赔数据进行元素区别编号;拼接所述数据集区别编号和所述元素区别编号,获得所述理赔数据集中每一条理赔数
据的...
【专利技术属性】
技术研发人员:陈奕宇,付园园,涂开欣,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。