基于近端策略优化车险欺诈识别模型的方法及其相关设备技术

技术编号：38429701 阅读：14 留言：0更新日期：2023-08-07 11:26

本申请实施例属于人工智能技术领域，应用于模型优化领域中，涉及一种基于近端策略优化车险欺诈识别模型的方法及其相关设备，包括通过获取未标注的车险结案数据；训练获得初训练的车险欺诈识别模型；获取已标注的车险结案数据；采用近端策略优化算法优化所述车险欺诈识别模型。通过引入PPO算法，使得在进行车险欺诈识别模型初训练时，无需再对大量的训练数据进行标注，只需在验证阶段，采用少量的已标注的验证数据，同时，结合PPO算法对所述车险欺诈识别模型进行策略选择概率动态调优，直至验证成功，则模型调优完成。减少人工大量标注时的人力物力消耗，采用PPO算法智能调整各个业务环节被选择的概率，从而智能化的对车险欺诈识别模型进行调优。模型进行调优。模型进行调优。

全部详细技术资料下载

【技术实现步骤摘要】
基于近端策略优化车险欺诈识别模型的方法及其相关设备

[0001]本申请涉及模型优化
，尤其涉及一种基于近端策略优化车险欺诈识别模型的方法及其相关设备。

技术介绍

[0002]在现有的车险理赔欺诈风险中，强化学习已经运用上了。在现有车险理赔风险欺诈的判断中的强化学习使用Deep
‑
Q
‑
Learning占了多数，此算法需要预先人工标注结果，即标记该案件是否为欺诈案件，是欺诈风险案件，非欺诈风险案件，如果不标记则缺失环境对智能体学习的影响。如学习欺诈场景，我们想要智能体学习到欺诈案件，但如果数据中包含了非欺诈案件，那么智能体就会学歪。
[0003]但是，如果模型训练的数据量较大，显然，对每一条数据都进行标注，然后标注之后再进行模型训练，会消耗极大的人力物力；而且，若人工标注大量的数据，极易出现标注错误的情况，也不够智能化，是否能够采用人工智能或者引入相关算法，在车险理赔欺诈风险识别中，进行智能化的标注，已成为了亟需解决的问题。因此，现有技术在车险理赔欺诈风险识别中，还存在模型标注和优化调整不够智能化的问题。

技术实现思路

[0004]本申请实施例的目的在于提出一种基于近端策略优化车险欺诈识别模型的方法及其相关设备，以解决现有技术在车险理赔欺诈风险识别中，还存在模型标注和优化调整不够智能化的问题。
[0005]为了解决上述技术问题，本申请实施例提供一种基于近端策略优化车险欺诈识别模型的方法，采用了如下所述的技术方案：
[0006]一种基于近端...

【技术保护点】

【技术特征摘要】
1.一种基于近端策略优化车险欺诈识别模型的方法，其特征在于，包括下述步骤：获取未标注的车险结案数据，其中，所述未标注的车险结案数据指未标注是否存在车险欺诈行为的车险结案数据；将所述未标注的车险结案数据输入到预构建的车险欺诈识别模型，进行模型训练，获得初训练的车险欺诈识别模型；获取已标注的车险结案数据，其中，所述已标注的车险结案数据指已标注是否存在车险欺诈行为的车险结案数据；将所述已标注的车险结案数据输入到所述初训练的车险欺诈识别模型，进行车险欺诈识别，获得模型输出结果；将所述模型输出结果与预设的标注结果进行对比校验，获得对比校验结果；判断所述对比校验结果是否符合预设的校验要求；若所述对比校验结果不符合预设的校验要求，则采用近端策略优化算法优化所述车险欺诈识别模型；直到所述对比校验结果符合预设的校验要求，模型优化完成，获得优化完成的车险欺诈识别模型。2.根据权利要求1所述的基于近端策略优化车险欺诈识别模型的方法，其特征在于，所述车险结案数据包括从车险投保环节至车险理赔结束环节的所有业务环节的数据，所述将所述未标注的车险结案数据输入到预构建的车险欺诈识别模型，进行模型训练的步骤，具体包括：根据业务环节的不同，对所述未标注的车险结案数据中每一条车险结案数据中各业务环节数据进行分类；基于预设的识别规则，计算各个业务环节存在车险欺诈行为的概率；采用综合分析法，综合获取所有业务环节存在车险欺诈行为的总概率；判断所述未标注的车险结案数据中每一条车险结案数据对应的总概率能否正常输出；若不能正常输出，则所述车险欺诈识别模型预训练失败，转人工进行车险欺诈识别模型构建问题检测处理；若能正常输出，则所述车险欺诈识别模型预训练成功。3.根据权利要求1所述的基于近端策略优化车险欺诈识别模型的方法，其特征在于，在执行所述获取已标注的车险结案数据的步骤之后，所述方法还包括：分别为所述已标注的车险结案数据设置唯一区别标识；所述将所述已标注的车险结案数据输入到所述初训练的车险欺诈识别模型，进行车险欺诈识别，获得模型输出结果的步骤，具体包括：根据业务环节的不同，对所述已标注的车险结案数据中每一条车险结案数据中各业务环节数据进行分类；基于预设的识别规则，计算各个业务环节存在车险欺诈行为的概率；采用综合分析法，综合获取所有业务环节存在车险欺诈行为的总概率；判断所述总概率是否超过预设的风控概率阈值；若超过，则将当前条车险结案数据输出为车险欺诈数据；若未超过，则将当前条车险结案数据输出为非车险欺诈数据。
4.根据权利要求2或3所述的基于近端策略优化车险欺诈识别模型的方法，其特征在于，所述基于预设的识别规则，计算各个业务环节存在车险欺诈行为的概率的步骤，具体包括：获取当前业务环节对应的分类数据，并对所述分类数据进行特征提取；根据特征提取结果，计算所述当前业务环节对应的特征值；根据预先设置的欺诈概率列表，确定所述特征值对应的概率值，其中，所述欺诈概率列表中预先设置了各个特征值区间对应的车险欺诈行为概率值。5.根据权利要求2或3所述的基于近端策略优化车险欺诈识别模型的方法，其特征在于，在执行所述采用综合分析法，综合获取所有业务环节存在车险欺诈行为的总概率的步骤之前，所述方法还包括：获取预先为各个业务环节设置的欺诈风险权重；所述采用...

【专利技术属性】
技术研发人员：陈奕宇，付园园，
申请(专利权)人：中国平安财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人