对话数据生成方法、模型训练方法、装置、设备及介质制造方法及图纸

技术编号：37151212 阅读：8 留言：0更新日期：2023-04-06 22:07

本公开提供了一种对话数据生成方法、模型训练方法、装置、设备及介质，涉及人工智能技术领域，尤其涉及自然语言处理领域。具体实现方案为：根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定对象代理的对话动作；以及根据对象代理的对话动作，确定目标对话数据。话数据。话数据。

全部详细技术资料下载

【技术实现步骤摘要】
对话数据生成方法、模型训练方法、装置、设备及介质

[0001]本公开涉及人工智能
，尤其涉及自然语言处理领域，更具体地，本公开提供了一种对话数据生成方法、深度学习模型的训练方法、对话数据生成装置、深度学习模型的训练装置、电子设备、存储介质以及计算机程序产品。

技术介绍

[0002]用户与系统之间可以通过对话来完成对话目标，例如完成预订餐厅、购买机票等对话目标。对话系统中的深度学习模型需要理解多轮对话信息来完成对话目标，训练该深度学习模型需要大量经过详细注释的对话数据集。然而，目前难以获得多样性丰富的对话数据集。

技术实现思路

[0003]本公开提供了一种对话数据生成方法、深度学习模型的训练方法、对话数据生成装置、深度学习模型的训练装置、电子设备、存储介质以及计算机程序产品。
[0004]根据本公开的一方面，提供了一种对话数据生成方法，包括：根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定对象代理的对话动作；以及根据对象代理的对话动作，确定目标对话数据。
[0005]根据本公开的另一方面，提供了一种深度学习模型的训练方法，包括：获取对话数据；利用对话数据训练深度学习模型；其中，对话数据是根据上述对话数据生成方法得到的。
[0006]根据本公开的另一方面，提供了一种对话数据生成装置，包括：第一确定模块和第二确定模块。第一确定模块用于根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定对象代理的对话动作；第二确定模块用于根据对象代理的对话动作，确定目标对...

【技术保护点】

【技术特征摘要】
1.一种对话数据生成方法，包括：根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定所述对象代理的对话动作；以及根据所述对象代理的对话动作，确定目标对话数据。2.根据权利要求1所述的方法，其中，所述对象代理包括用户代理；所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定所述对象代理的对话动作包括：根据所述用户代理的对话状态，从所述多个预定对话流程中确定目标对话流程；以及根据所述用户代理的对话状态和所述目标对话流程，确定所述用户代理的对话动作。3.根据权利要求2所述的方法，其中，所述多个预定对话流程包括告知流程、询问流程和修正对话目标流程中的至少一个；其中，所述用户代理的对话状态包括针对当前接口的至少一个可告知词槽各自的填充状态，所述告知流程表征基于所述至少一个可告知词槽中处于未填充状态的词槽进行告知；所述用户代理的对话状态包括针对所述当前接口的至少一个可询问词槽各自的填充状态，所述询问流程表征基于所述至少一个可询问词槽中处于未填充状态的词槽进行询问；以及所述修正对话目标流程表征将当前对话目标修正为其他对话目标。4.根据权利要求1所述的方法，其中，所述对象代理包括系统代理，所述系统代理的对话状态包括针对当前接口的至少一个可告知词槽各自的填充状态；所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定所述对象代理的对话动作包括：响应于所述至少一个可告知词槽中存在填充状态是未填充的词槽且所述目标对话流程是词槽填充流程，根据处于未填充状态的可告知词槽，确定所述系统代理的对话动作。5.根据权利要求1所述的方法，其中，所述对象代理包括系统代理，所述系统代理的对话状态包括针对当前接口的至少一个可告知词槽各自的填充状态；所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定所述对象代理的对话动作包括：响应于所述至少一个可告知词槽各自填充状态是已填充且所述目标对话流程是答复流程，根据所述至少一个可告知词槽各自的词槽值，调用所述当前接口，以得到调用结果；以及根据所述调用结果，确定所述系统代理的对话动作。6.根据权利要求1所述的方法，其中，所述对象代理包括系统代理，所述系统代理的对话状态包括针对当前对话目标的完成状态；所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定所述对象代理的对话动作包括：响应于所述当前对话目标的完成状态是已完成且所述目标对话流程是新增对话流程，根据与所述当前对话目标相关的其他对话目标，确定所述系统代理的对话动作。7.根据权利要求1所述的方法，其中，所述对象代理包括用户代理和系统代理，所述方法还包括：
根据所述用户代理和所述系统代理中第一代理的对话动作，更新所述用户代理和所述系统代理中第二代理的对话状态。8.根据权利要求1所述的方法，其中，所述根据所述对象代理的对话动作，确定目标对话数据包括：根据预定模板和与所述对象代理的对话动作对应的词槽值，确定所述目标对话数据。9.根据权利要求1至8中任意一项所述的方法，还包括：根据参考对话的参考意图序列，确定目标意图序列，得到所述目标对话数据的对话目标；其中，所述目标意图序列中的每个意图对应至少一个接口，每个接口对应至少一个词槽。10.一种深度学习模型的训练方法，包括：获取对话数据；利用所述对话数据训练深度学习模型；其中，所述对话数据是根据权利要求1～9所述的方法得到的。11.一种对话数据生成装置，包括：第一确定模块，用于根据对象代理的对话状态和多个预定对话流程中的目标对话流程，确定所述对象代理的对话动作；以及第二确定模块，用于根据所述对象代理的对话动作，确定目标对话数据。12.根据权利要求11所述的装置，其中...

【专利技术属性】
技术研发人员：刘军文，胡江鹭，孙辉丰，孙叔琦，常月，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人