本申请公开了对话处理模型的训练方法、对话处理方法、装置及设备,属于人工智能技术领域。方法包括:获取多个客服对话语段,多个客服对话语段对应的任务类型包括分类任务和/或生成任务;调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果;基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型。对话处理模型适用于处理分类任务和/或生成任务对应的客服对话语段,适用范围较广。由于客服对话语段能够包括客服领域的知识,对话处理模型能够学习到客服领域的知识,对话处理模型处理客服领域的语段得到的处理结果的准确性较高。结果的准确性较高。结果的准确性较高。
【技术实现步骤摘要】
对话处理模型的训练方法、对话处理方法、装置及设备
[0001]本申请实施例涉及人工智能
,特别涉及一种对话处理模型的训练方法、对话处理方法、装置及设备。
技术介绍
[0002]随着人工智能技术的发展,人工智能模型广泛应用于各类任务处理中。例如,可以使用对话处理相关的人工智能模型处理对话相关的任务。
技术实现思路
[0003]本申请实施例提供了一种对话处理模型的训练方法、对话处理方法、装置及设备,以扩大对话处理模型的适用范围,提高对话处理模型输出的处理结果的准确性。技术方案如下:
[0004]一方面,本申请实施例提供了一种对话处理模型的训练方法,该方法包括:
[0005]获取多个客服对话语段,多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务,生成任务是指任务目标为生成客服对话语段相关的目标语段的任务;
[0006]调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果;
[0007]基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型,对话处理模型用于对目标客服对话语段进行处理。
[0008]在一种可能的实现方式中,调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果,包括:对于多个客服对话语段中的任一个客服对话语段,调用初始处理模型输出基于该任一个客服对话语段包括的任务提示预测得到的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
[0009]在一种可能的实现方式中,获取多个客服对话语段,包括:获取多个初始客服对话语段,任一个初始客服对话语段具有第一标签,第一标签用于指示该任一个初始客服对话语段的任务目标;根据第一标签,为该任一个初始客服对话语段添加任务提示,任务提示包括任务类型提示或任务目标提示中的至少一种;将添加任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。
[0010]在一种可能的实现方式中,根据第一标签,为该任一个初始客服对话语段添加任务提示,包括:根据第一标签,查询标签与任务提示的对应关系,得到第一标签对应的任务提示;为该任一个初始客服对话语段添加任务提示。
[0011]在一种可能的实现方式中,任一个客服对话语段的处理结果包括至少一个字符,基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,包括:对于该任一个客服对话语段,获取该任一个客服对话语段的处理结果包括的各个字符的输出概
率;基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失;基于多个客服对话语段对应的生成损失,获取第一目标损失。
[0012]在一种可能的实现方式中,基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失,包括:将各个字符的输出概率代入生成损失函数,获取该任一个客服对话语段对应的生成损失;其中,对于对应于不同任务类型的多个客服对话语段,获取多个客服对话语段的生成损失时使用的生成损失函数相同。
[0013]在一种可能的实现方式中,得到对话处理模型之后,该方法还包括:获取至少一个参考客服对话语段,至少一个参考客服对话语段对应目标任务类型,目标任务类型为分类任务或生成任务;根据至少一个参考客服对话语段的第二标签,为至少一个参考客服对话语段添加任务提示,得到多个目标客服对话语段,第二标签用于指示第二标签对应的参考客服对话语段的任务目标;调用对话处理模型对多个目标客服对话语段进行处理,输出目标任务类型对应的多个目标客服对话语段的处理结果;基于多个目标客服对话语段和多个目标客服对话语段的处理结果,获取第二目标损失,利用第二目标损失更新对话处理模型,得到目标任务类型对应的对话处理模型。
[0014]另一方面,本申请实施例提供了一种对话处理方法,该方法包括:
[0015]获取至少一个客服对话语段和对话处理模型,至少一个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,对话处理模型是按照上述任一种对话处理模型的训练方法训练得到的;
[0016]调用对话处理模型对至少一个客服对话语段进行处理,输出至少一个客服对话语段的处理结果。
[0017]在一种可能的实现方式中,调用对话处理模型对至少一个客服对话语段进行处理,输出至少一个客服对话语段的处理结果,包括:对于至少一个客服对话语段中的任一个客服对话语段,调用对话处理模型预测该任一个客服对话语段的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
[0018]另一方面,提供了一种对话处理模型的训练装置,该装置包括:
[0019]获取模块,用于获取多个客服对话语段,多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务,生成任务是指任务目标为生成客服对话语段相关的目标语段的任务;
[0020]处理模块,用于调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果;
[0021]更新模块,用于基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型,对话处理模型用于对目标客服对话语段进行处理。
[0022]在一种可能的实现方式中,处理模块,用于对于多个客服对话语段中的任一个客服对话语段,调用初始处理模型输出基于该任一个客服对话语段包括的任务提示预测得到的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
[0023]在一种可能的实现方式中,获取模块,用于获取多个初始客服对话语段,任一个初始客服对话语段具有第一标签,第一标签用于指示该任一个初始客服对话语段的任务目
标;根据第一标签,为该任一个初始客服对话语段添加任务提示,任务提示包括任务类型提示或任务目标提示中的至少一种;将添加任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。
[0024]在一种可能的实现方式中,获取模块,用于根据第一标签,查询标签与任务提示的对应关系,得到第一标签对应的任务提示;为该任一个初始客服对话语段添加任务提示。
[0025]在一种可能的实现方式中,任一个客服对话语段的处理结果包括至少一个字符,更新模块,用于对于该任一个客服对话语段,获取该任一个客服对话语段的处理结果包括的各个字符的输出概率;基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失;基于多个客服对话语段对应的生成损失,获取第一目标损失。
[0026]在一种可能的实现方式中,更新模块,用于将各个字符的输出概率代入生成损失函数,获取该任一个客服对话语段对应的生成损失;其中,对于对应于不同任务类型的多个客服对话语段,获取多个客服对话语段的生成损失时使用的生成损失函数相同。
[0027]在本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种对话处理模型的训练方法,其特征在于,所述方法包括:获取多个客服对话语段,所述多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,所述分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务,所述生成任务是指任务目标为生成客服对话语段相关的目标语段的任务;调用初始处理模型对所述多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果;基于所述多个客服对话语段和所述多个客服对话语段的处理结果,获取第一目标损失,利用所述第一目标损失更新所述初始处理模型,得到对话处理模型,所述对话处理模型用于对目标客服对话语段进行处理。2.根据权利要求1所述的方法,其特征在于,所述调用初始处理模型对所述多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果,包括:对于所述多个客服对话语段中的任一个客服对话语段,调用初始处理模型输出基于所述任一个客服对话语段包括的任务提示预测得到的任务目标,将所述任务目标作为所述任一个客服对话语段的处理结果。3.根据权利要求2所述的方法,其特征在于,所述获取多个客服对话语段,包括:获取多个初始客服对话语段,任一个初始客服对话语段具有第一标签,所述第一标签用于指示所述任一个初始客服对话语段的任务目标;根据所述第一标签,为所述任一个初始客服对话语段添加任务提示,所述任务提示包括任务类型提示或任务目标提示中的至少一种;将添加所述任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。4.根据权利要求1
‑
3中任一所述的方法,其特征在于,任一个客服对话语段的处理结果包括至少一个字符,所述基于所述多个客服对话语段和所述多个客服对话语段的处理结果,获取第一目标损失,包括:对于所述任一个客服对话语段,获取所述任一个客服对话语段的处理结果包括的各个字符的输出概率;基于所述各个字符的输出概率,获取所述任一个客服对话语段对应的生成损失;基于所述多个客服对话语段对应的生成损失,获取所述第一目标损失。5.根据权利要求4所述的方法,其特征在于,所述基于所述各个字符的输出概率,获取所述任一个客服对话语段对应的生成损失,包括:将所述各个字符的输出概率代入生成损失函数,获取所述任一个客服对话语段对应的生成损失;其中,对于对应于不同任务类型的多个客服对话语段,获取所述多个客服对话语段的生成损失时使用的生成损失函数相同。6.根据权利要求1
‑
3,5中任一所述的方法,其特征在于,所述得到对话处理模型之后,还包括:获取至少一个参考客服对话语段,所述至少一个参考客服对话语段对应目标任务类型,所...
【专利技术属性】
技术研发人员:何可清,王金刚,张宏毅,徐志坚,陈见耸,孙超博,武威,于利前,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。