文本预测模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：39419764 阅读：12 留言：0更新日期：2023-11-19 16:08

本发明专利技术涉及人工智能领域，公开了一种文本预测模型训练方法，该方法：获取样本数据集；根据历史文本数据、协谈数据以及样本标签对第一预设模型进行训练，得到教师模型；根据历史文本数据以及教师模型对第二预设模型进行知识蒸馏，得到学生模型；通过学生模型对所有样本数据进行预测，得到第一预测标签；根据样本标签和第一预测标签，确定学生模型的预测损失值；在预测损失值达到收敛条件时，将学生模型确定为文本预测模型。本发明专利技术通过教师模型对第二预测训练模型进行知识蒸馏，使得教师模型的预测能力迁移到学生模型，实现了将离线训练的数据迁移到线上预测模型，以及提高了保险领域行业中文本数据的处理效率和准确性，改善了文本预测模型的性能。本预测模型的性能。本预测模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
文本预测模型训练方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种文本预测模型训练方法、装置、设备及存储介质。

技术介绍

[0002]随着社会的不断发展，保险公司的业务也相应实现快速发展。越来越多的赔付案件需要进行赔付审核，从而确定赔付案件是否符合赔付条件。在赔付案件审核时需要严格管控风险，从而降低潜在损失。
[0003]现有技术中，往往是通过保险公司的工作人员对赔付案件的案件信息和案件内容进行审核，但是由于涉及的案件数量较多，进而导致保险公司的工作人员审核赔付案件的效率低。并且在保险公司的工作人员审核案件过程中容易出现判断失误，从而导致保险公司的工作人员审核案件的准确性较低。并且人工调查和人工协谈等信息数据在线上预测时无法获取，进而导致整个案件处理效率较低，严重影响了用户的体验。

技术实现思路

[0004]本专利技术实施例提供一种文本预测模型训练方法、装置、设备及存储介质，以解决现有技术中保险公司赔付案件处理效率较低的问题。
[0005]一种文本预测模型训练方法，包括：
[0006]获取样本数据集；所述样本数据集包括至少一个样本数据以及与所述样本数据对应的样本标签；所述样本数据包括历史文本数据和协谈数据；
[0007]根据所述历史文本数据、所述协谈数据以及所述样本标签对第一预设模型进行训练，得到教师模型；
[0008]根据所述历史文本数据以及所述教师模型对第二预设模型进行知识蒸馏，得到学生模型；
[0009]通过所述学...

【技术保护点】

【技术特征摘要】
1.一种文本预测模型训练方法，其特征在于，包括：获取样本数据集；所述样本数据集包括至少一个样本数据以及与所述样本数据对应的样本标签；所述样本数据包括历史文本数据和协谈数据；根据所述历史文本数据、所述协谈数据以及所述样本标签对第一预设模型进行训练，得到教师模型；根据所述历史文本数据以及所述教师模型对第二预设模型进行知识蒸馏，得到学生模型；通过所述学生模型对所有所述样本数据进行预测，得到与所述样本数据对应的第一预测标签；根据与同一所述样本数据对应的所述样本标签和所述第一预测标签，确定所述学生模型的预测损失值；在所述预测损失值达到收敛条件时，将收敛之后的所述学生模型确定为文本预测模型。2.如权利要求1所述的文本预测模型训练方法，其特征在于，所述根据所述历史文本数据、所述协谈数据以及所述样本标签对所述第一预设模型进行训练，得到教师模型，包括：将所有所述样本数据以及所有所述样本标签输入至所述第一预设模型中，通过所述第一预设模型对所述样本数据中的所述历史文本数据和所述协谈数据进行预测，得到第二预测标签；根据与同一所述样本数据对应的所述样本标签和所述第二预测标签，确定所述第一预设模型的交叉熵损失值；在所述交叉熵损失值未达到预设的收敛条件时，迭代更新所述第一预设模型中的初始参数，直至所述交叉熵损失值达到所述收敛条件时，将收敛之后的所述第一预设模型记录为教师模型。3.如权利要求1所述的文本预测模型训练方法，其特征在于，所述根据所述历史文本数据以及所述教师模型对第二预设模型进行知识蒸馏，得到学生模型，包括：将与同一所述样本数据对应的所述历史文本数据和第二预测标签输入至所述第二预设模型中，通过所述第二预设模型对所述样本数据进行预测，得到第三预测标签；根据与同一所述样本数据对应的所述第二预测标签和所述第三预测标签，确定所述第二预设模型的标签预测损失值；根据所述标签预测损失值对所述第二预设模型的初始参数进行优化处理，得到所述学生模型。4.如权利要求1所述的文本预测模型训练方法，其特征在于，所述通过所述学生模型对所有所述样本数据进行预测，得到与所述样本数据对应的第一预测标签，包括：通过所述学生模型中的特征交叉模块对所述样本数据进行交叉处理，得到第一输出向量；通过所述学生模型中的深度神经网络模块对所述样本数据进行特征组合，得到第二输出向量；通过所述学生模型中的输出模块对所述第一输出向量和所述第二输出向量进行预测，得到所述第一预测标签。
5.如权利要求1所述的文本预测模型训练方法，其特征在于，...

【专利技术属性】
技术研发人员：车天博，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人