文本预测模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:39419764 阅读:12 留言:0更新日期:2023-11-19 16:08
本发明专利技术涉及人工智能领域,公开了一种文本预测模型训练方法,该方法:获取样本数据集;根据历史文本数据、协谈数据以及样本标签对第一预设模型进行训练,得到教师模型;根据历史文本数据以及教师模型对第二预设模型进行知识蒸馏,得到学生模型;通过学生模型对所有样本数据进行预测,得到第一预测标签;根据样本标签和第一预测标签,确定学生模型的预测损失值;在预测损失值达到收敛条件时,将学生模型确定为文本预测模型。本发明专利技术通过教师模型对第二预测训练模型进行知识蒸馏,使得教师模型的预测能力迁移到学生模型,实现了将离线训练的数据迁移到线上预测模型,以及提高了保险领域行业中文本数据的处理效率和准确性,改善了文本预测模型的性能。本预测模型的性能。本预测模型的性能。

【技术实现步骤摘要】
文本预测模型训练方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种文本预测模型训练方法、装置、设备及存储介质。

技术介绍

[0002]随着社会的不断发展,保险公司的业务也相应实现快速发展。越来越多的赔付案件需要进行赔付审核,从而确定赔付案件是否符合赔付条件。在赔付案件审核时需要严格管控风险,从而降低潜在损失。
[0003]现有技术中,往往是通过保险公司的工作人员对赔付案件的案件信息和案件内容进行审核,但是由于涉及的案件数量较多,进而导致保险公司的工作人员审核赔付案件的效率低。并且在保险公司的工作人员审核案件过程中容易出现判断失误,从而导致保险公司的工作人员审核案件的准确性较低。并且人工调查和人工协谈等信息数据在线上预测时无法获取,进而导致整个案件处理效率较低,严重影响了用户的体验。

技术实现思路

[0004]本专利技术实施例提供一种文本预测模型训练方法、装置、设备及存储介质,以解决现有技术中保险公司赔付案件处理效率较低的问题。
[0005]一种文本预测模型训练方法,包括:
[0006]获取样本数据集;所述样本数据集包括至少一个样本数据以及与所述样本数据对应的样本标签;所述样本数据包括历史文本数据和协谈数据;
[0007]根据所述历史文本数据、所述协谈数据以及所述样本标签对第一预设模型进行训练,得到教师模型;
[0008]根据所述历史文本数据以及所述教师模型对第二预设模型进行知识蒸馏,得到学生模型;
[0009]通过所述学生模型对所有所述样本数据进行预测,得到与所述样本数据对应的第一预测标签;
[0010]根据与同一所述样本数据对应的所述样本标签和所述第一预测标签,确定所述学生模型的预测损失值;
[0011]在所述预测损失值达到收敛条件时,将收敛之后的所述学生模型确定为文本预测模型。
[0012]一种文本预测模型训练装置,包括:
[0013]数据获取模块,用于获取样本数据集;所述样本数据集包括至少一个样本数据以及与所述样本数据对应的样本标签;所述样本数据包括历史文本数据和协谈数据;
[0014]模型训练模块,用于根据所述历史文本数据、所述协谈数据以及所述样本标签对第一预设模型进行训练,得到教师模型;
[0015]模型蒸馏模块,用于根据所述历史文本数据以及所述教师模型对第二预设模型进
行知识蒸馏,得到学生模型;
[0016]标签预测模块,用于通过所述学生模型对所有所述样本数据进行预测,得到与所述样本数据对应的第一预测标签;
[0017]损失预测模块,用于根据与同一所述样本数据对应的所述样本标签和所述第一预测标签,确定所述学生模型的预测损失值;
[0018]模型收敛模块,用于在所述预测损失值达到收敛条件时,将收敛之后的所述学生模型确定为文本预测模型。
[0019]一种文本预测方法,包括:
[0020]获取至少一个待处理数据,所述待处理数据包括文本数据;
[0021]调用文本预测模型,所述文本预测模型为根据上述所述文本预测模型训练方法训练得到的;
[0022]基于所述文本预测模型对所述待处理数据中的文本数据进行预测,得到文本预测结果。
[0023]一种文本预测装置,包括:
[0024]获取模块,用于获取至少一个待处理数据,所述待处理数据包括文本数据;
[0025]调用模块,用于调用文本预测模型,所述文本预测模型为根据上述所述文本预测模型训练方法训练得到的;
[0026]预测模块,用于基于所述文本预测模型对所述待处理数据中的文本数据进行预测,得到文本预测结果。
[0027]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文本预测模型训练方法,或所述处理器执行所述计算机程序时实现上述所述文本预测方法。
[0028]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述文本预测模型训练方法,或所述处理器执行所述计算机程序时实现上述所述文本预测方法。
[0029]本专利技术提供一种文本预测模型训练方法、装置、设备及存储介质,该方法通过样本数据和样本标签对第一预设模型进行训练,直至第一预设模型收敛,从而实现了对教师模型的获取,进而实现了教师模型可以对离线数据(即协谈数据)的预测能力。通过历史文本数据以及教师模型对第二预测训练模型进行知识蒸馏,从而使得教师模型的预测能力迁移到学生模型上,进而实现了将离线的协谈数据迁移到线上预测模型,以及提高了保险领域行业中文本数据的处理效率。通过样本数据对学生模型进行预测,并将预测得到的第一预测标签和样本标签进行损失值计算,从而实现了在损失值收敛时对文本预测模型的确定,以及增强了文本中不同特征之间的联系,进而提高了保险领域行业中文本预测模型的准确性,改善了文本预测模型的性能。
附图说明
[0030]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
[0031]图1是本专利技术一实施例中文本预测模型训练方法的应用环境示意图;
[0032]图2是本专利技术一实施例中文本预测模型训练方法的流程图;
[0033]图3是本专利技术一实施例中文本预测方法的流程图;
[0034]图4是本专利技术一实施例中文本预测模型训练装置的原理框图;
[0035]图5是本专利技术一实施例中文本预测方法的原理框图;
[0036]图6是本专利技术一实施例中计算机设备的示意图。
具体实施方式
[0037]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0038]本专利技术实施例提供的文本预测模型训练方法,该文本预测模型训练方法可应用如图1所示的应用环境中。具体地,该文本预测模型训练方法应用在文本预测模型训练装置中,该文本预测模型训练装置包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决现有技术中案件处理效率较低的问题。其中,该服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。客户端又称为用户端,是指与服务器相对应,为客户提供分类服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本预测模型训练方法,其特征在于,包括:获取样本数据集;所述样本数据集包括至少一个样本数据以及与所述样本数据对应的样本标签;所述样本数据包括历史文本数据和协谈数据;根据所述历史文本数据、所述协谈数据以及所述样本标签对第一预设模型进行训练,得到教师模型;根据所述历史文本数据以及所述教师模型对第二预设模型进行知识蒸馏,得到学生模型;通过所述学生模型对所有所述样本数据进行预测,得到与所述样本数据对应的第一预测标签;根据与同一所述样本数据对应的所述样本标签和所述第一预测标签,确定所述学生模型的预测损失值;在所述预测损失值达到收敛条件时,将收敛之后的所述学生模型确定为文本预测模型。2.如权利要求1所述的文本预测模型训练方法,其特征在于,所述根据所述历史文本数据、所述协谈数据以及所述样本标签对所述第一预设模型进行训练,得到教师模型,包括:将所有所述样本数据以及所有所述样本标签输入至所述第一预设模型中,通过所述第一预设模型对所述样本数据中的所述历史文本数据和所述协谈数据进行预测,得到第二预测标签;根据与同一所述样本数据对应的所述样本标签和所述第二预测标签,确定所述第一预设模型的交叉熵损失值;在所述交叉熵损失值未达到预设的收敛条件时,迭代更新所述第一预设模型中的初始参数,直至所述交叉熵损失值达到所述收敛条件时,将收敛之后的所述第一预设模型记录为教师模型。3.如权利要求1所述的文本预测模型训练方法,其特征在于,所述根据所述历史文本数据以及所述教师模型对第二预设模型进行知识蒸馏,得到学生模型,包括:将与同一所述样本数据对应的所述历史文本数据和第二预测标签输入至所述第二预设模型中,通过所述第二预设模型对所述样本数据进行预测,得到第三预测标签;根据与同一所述样本数据对应的所述第二预测标签和所述第三预测标签,确定所述第二预设模型的标签预测损失值;根据所述标签预测损失值对所述第二预设模型的初始参数进行优化处理,得到所述学生模型。4.如权利要求1所述的文本预测模型训练方法,其特征在于,所述通过所述学生模型对所有所述样本数据进行预测,得到与所述样本数据对应的第一预测标签,包括:通过所述学生模型中的特征交叉模块对所述样本数据进行交叉处理,得到第一输出向量;通过所述学生模型中的深度神经网络模块对所述样本数据进行特征组合,得到第二输出向量;通过所述学生模型中的输出模块对所述第一输出向量和所述第二输出向量进行预测,得到所述第一预测标签。
5.如权利要求1所述的文本预测模型训练方法,其特征在于,...

【专利技术属性】
技术研发人员:车天博
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1