对话处理模型的训练方法、对话处理方法、装置及设备制造方法及图纸

技术编号：36525957 阅读：11 留言：0更新日期：2023-02-01 16:04

本申请公开了对话处理模型的训练方法、对话处理方法、装置及设备，属于人工智能技术领域。方法包括：获取多个客服对话语段，多个客服对话语段对应的任务类型包括分类任务和/或生成任务；调用初始处理模型对多个客服对话语段进行处理，输出各个任务类型对应的客服对话语段的处理结果；基于多个客服对话语段和多个客服对话语段的处理结果，获取第一目标损失，利用第一目标损失更新初始处理模型，得到对话处理模型。对话处理模型适用于处理分类任务和/或生成任务对应的客服对话语段，适用范围较广。由于客服对话语段能够包括客服领域的知识，对话处理模型能够学习到客服领域的知识，对话处理模型处理客服领域的语段得到的处理结果的准确性较高。结果的准确性较高。结果的准确性较高。

全部详细技术资料下载

【技术实现步骤摘要】
对话处理模型的训练方法、对话处理方法、装置及设备

[0001]本申请实施例涉及人工智能
，特别涉及一种对话处理模型的训练方法、对话处理方法、装置及设备。

技术介绍

[0002]随着人工智能技术的发展，人工智能模型广泛应用于各类任务处理中。例如，可以使用对话处理相关的人工智能模型处理对话相关的任务。

技术实现思路

[0003]本申请实施例提供了一种对话处理模型的训练方法、对话处理方法、装置及设备，以扩大对话处理模型的适用范围，提高对话处理模型输出的处理结果的准确性。技术方案如下：
[0004]一方面，本申请实施例提供了一种对话处理模型的训练方法，该方法包括：
[0005]获取多个客服对话语段，多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种，分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务，生成任务是指任务目标为生成客服对话语段相关的目标语段的任务；
[0006]调用初始处理模型对多个客服对话语段进行处理，输出各个任务类型对应的客服对话语段的处理结果；
[0007]基于多个客服对话语段和多个客服对话语段的处理结果，获取第一目标损失，利用第一目标损失更新初始处理模型，得到对话处理模型，对话处理模型用于对目标客服对话语段进行处理。
[0008]在一种可能的实现方式中，调用初始处理模型对多个客服对话语段进行处理，输出各个任务类型对应的客服对话语段的处理结果，包括：对于多个客服对话语段中的任一个客服对话语段，调用初始处理模型输...

【技术保护点】

【技术特征摘要】
1.一种对话处理模型的训练方法，其特征在于，所述方法包括：获取多个客服对话语段，所述多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种，所述分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务，所述生成任务是指任务目标为生成客服对话语段相关的目标语段的任务；调用初始处理模型对所述多个客服对话语段进行处理，输出各个任务类型对应的客服对话语段的处理结果；基于所述多个客服对话语段和所述多个客服对话语段的处理结果，获取第一目标损失，利用所述第一目标损失更新所述初始处理模型，得到对话处理模型，所述对话处理模型用于对目标客服对话语段进行处理。2.根据权利要求1所述的方法，其特征在于，所述调用初始处理模型对所述多个客服对话语段进行处理，输出各个任务类型对应的客服对话语段的处理结果，包括：对于所述多个客服对话语段中的任一个客服对话语段，调用初始处理模型输出基于所述任一个客服对话语段包括的任务提示预测得到的任务目标，将所述任务目标作为所述任一个客服对话语段的处理结果。3.根据权利要求2所述的方法，其特征在于，所述获取多个客服对话语段，包括：获取多个初始客服对话语段，任一个初始客服对话语段具有第一标签，所述第一标签用于指示所述任一个初始客服对话语段的任务目标；根据所述第一标签，为所述任一个初始客服对话语段添加任务提示，所述任务提示包括任务类型提示或任务目标提示中的至少一种；将添加所述任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。4.根据权利要求1
‑
3中任一所述的方法，其特征在于，任一个客服对话语段的处理结果包括至少一个字符，所述基于所述多个客服对话语段和所述多个客服对话语段的处理结果，获取第一目标损失，包括：对于所述任一个客服对话语段，获取所述任一个客服对话语段的处理结果包括的各个字符的输出概率；基于所述各个字符的输出概率，获取所述任一个客服对话语段对应的生成损失；基于所述多个客服对话语段对应的生成损失，获取所述第一目标损失。5.根据权利要求4所述的方法，其特征在于，所述基于所述各个字符的输出概率，获取所述任一个客服对话语段对应的生成损失，包括：将所述各个字符的输出概率代入生成损失函数，获取所述任一个客服对话语段对应的生成损失；其中，对于对应于不同任务类型的多个客服对话语段，获取所述多个客服对话语段的生成损失时使用的生成损失函数相同。6.根据权利要求1
‑
3，5中任一所述的方法，其特征在于，所述得到对话处理模型之后，还包括：获取至少一个参考客服对话语段，所述至少一个参考客服对话语段对应目标任务类型，所...

【专利技术属性】
技术研发人员：何可清，王金刚，张宏毅，徐志坚，陈见耸，孙超博，武威，于利前，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人