对话模型的训练方法、训练装置、对话方法及对话系统制造方法及图纸

技术编号:17407246 阅读:58 留言:0更新日期:2018-03-07 05:00
本发明专利技术公开了一种对话模型的训练方法、训练装置、对话方法及对话系统。在总误差构建步骤,构建同时包含自然语言理解模型的第一误差和策略生成模型的第二误差的总误差函数。在联合训练步骤,以使总误差函数减小为目标,使用语料样本对自然语言理解模型和策略生成模型进行联合训练,其中,自然语言理解模型的输入为对话语句,输出为对对话语句进行解析得到的内部表示,策略生成模型的输入至少包括自然语言理解模型的输出,策略生成模型的输出为针对对话语句作出的动作。与现有技术相比,在自然语言理解模型或策略生成模型出现误差的时候,系统可以正常的进行对话,解决了传统方法中将自然语言理解模型和对话管理模型分开建模而导致的误差传递问题。

The training method, the training device, the dialogue method and the dialogue system of the dialogue model

The invention discloses a training method, a training device, a dialogue method and a dialogue system for a dialogue model. In the total error construction step, the total error function of the second error of the first error and the strategy generation model, which includes the natural language understanding model, is constructed. The joint training steps, so the total error function decreases as the goal of natural language understanding model and strategy generating model of joint training, the use of corpus samples among them, natural language understanding model as the input output statement for the internal dialogue, resolved to dialogue statement, strategy generating model input includes at least the natural language understanding the output of the model, the output model for strategy generation dialog actions. Compared with the existing technology, when the error occurs in natural language understanding model or policy generation model, the system can carry on normal dialogue, which solves the problem of error transfer caused by modeling the natural language understanding model and dialogue management model separately.

【技术实现步骤摘要】
对话模型的训练方法、训练装置、对话方法及对话系统
本专利技术涉及人机对话领域,特别是涉及一种对话模型的训练方法、训练装置、对话方法及对话系统。
技术介绍
传统的对话系统一般可以概括为以下三个阶段:1)用户通过文本或者语音进行输入,自然语言理解(NLU)模块将用户的输入进行解析,得到结构化的内部表示。2)对话管理(DM)模块接收到结构化的内部表示,根据历史的系统状态进行更新,得到最新的系统状态,再根据提前制定好的对话策略来选择与最新的系统状态对应的系统动作,交给下一个模块。3)最后,自然语言生成(NLG)模块负责将系统动作转换成人类能够理解的自然语言或者语音输出。在用户接收到系统的输出后,如果继续对话,则返回1)。在上述的流程中,都需要事先通过自然语言理解模块对用户输入的文本或语音进行解析,然后将其传递给对话管理模块。由于传统的对话系统中自然语言理解模块和对话管理模块是分开建模的,两者出现的错误均会影响最终结果,例如,在自然语言理解模块出现问题时,自然语言理解模块产生的误差会传递给对话管理模块,使得对话管理模块不能正常进行。而在实际过程中,自然语言理解模块或对话管理模块的错误是无法避免本文档来自技高网...
对话模型的训练方法、训练装置、对话方法及对话系统

【技术保护点】
一种对话模型的训练方法,包括:总误差构建步骤,构建同时包含自然语言理解模型的第一误差和策略生成模型的第二误差的总误差函数;联合训练步骤,以使所述总误差函数减小为目标,使用语料样本对所述自然语言理解模型和所述策略生成模型进行联合训练,其中,所述自然语言理解模型的输入为对话语句,输出为对所述对话语句进行解析得到的内部表示,所述策略生成模型的输入至少包括所述自然语言理解模型的输出,所述策略生成模型的输出为针对所述对话语句作出的动作。

【技术特征摘要】
1.一种对话模型的训练方法,包括:总误差构建步骤,构建同时包含自然语言理解模型的第一误差和策略生成模型的第二误差的总误差函数;联合训练步骤,以使所述总误差函数减小为目标,使用语料样本对所述自然语言理解模型和所述策略生成模型进行联合训练,其中,所述自然语言理解模型的输入为对话语句,输出为对所述对话语句进行解析得到的内部表示,所述策略生成模型的输入至少包括所述自然语言理解模型的输出,所述策略生成模型的输出为针对所述对话语句作出的动作。2.根据权利要求1所述的训练方法,其中,所述自然语言理解模型为序列标注模型,所述序列标注模型的输入为所述对话语句的词序列,所述序列标注模型的输出为所述词序列对应的槽位和所述词序列表示的意图信息。3.根据权利要求1所述的训练方法,其中,针对当前轮次的对话语句,所述策略生成模型的输入包括:所述自然语言理解模型针对当前轮次的对话语句的输出;和所述策略生成模型针对上一轮次的对话语句输出的动作和/或当前轮次信息。4.根据权利要求1所述的训练方法,其中,所述策略生成模型为马尔科夫决策模型,所述策略生成模型以使得输出的动作得到的回报值尽可能多为目标,求取针对所述对话语句作出的动作,其中,所述回报值包括针对当前系统状态采取动作得到的立即回报和长期回报。5.根据权利要求1所述的训练方法,其中,所述总误差函数为其中,θ表示所述自然语言理解模型和所述策略生成模型构成的整个网络的参数集合,所述第一误差包括意图识别误差Lintent和槽填充误差Ltag,Lact表示第二误差,λ为学习速率参数,α、β为超参数,用于...

【专利技术属性】
技术研发人员:戴文渊杨强陈雨强李可邢少敏
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1