【技术实现步骤摘要】
对话生成方法及装置
本专利技术涉及互联网
,特别涉及一种对话生成方法及装置。
技术介绍
随着科学技术以及经济水平的快速发展,当今社会正在逐步往服务型社会转变,以更好地为用户提供服务。时下流行的智能对话系统正是基于上述理念产生的。其中,智能对话系统在接收到用户终端发起的提问后,可以自动对该提问进行回答,在一来一往的提问与回答过程中,便形成了人与机器之间的对话。相关技术中,主要通过两类智能对话系统实现对话生成,一类为智能客服,另一类为智能平台。其中,智能客服为了实现人机对话功能,通常会收集海量的对话语料以进行模型训练,进而基于训练出的线性模型以及简单的上下文特征对用户的提问进行回答,从而产生对话。目前智能平台包括api.ai、wit.ai等,这类智能平台为了实现人机对话功能,同样也需收集海量的对话语料以进行模型训练,进而基于训练出的模型以及简答的上下文对用户的提问进行回答,从而产生对话。在实现本专利技术的过程中,专利技术人发现相关技术至少存在以下问题:无论针对上述哪一类智能对话系统来说,均需要收集海量的对话语料以进行模型训练,而收集海量的对话语料通常需消耗大量的 ...
【技术保护点】
一种对话生成方法,其特征在于,所述方法包括:获取训练对话语料以及对所述训练对话语料的第一实体标注结果;根据所述训练对话语料以及所述第一实体标注结果,训练第一参数模型;基于所述第一参数模型,对所述训练对话语料执行对话语料重组扩展处理,得到重组扩展对话语料;根据所述训练对话语料、所述第一实体标注结果、所述重组扩展对话语料以及对所述重组扩展对话语料的第二实体标注结果,训练第二参数模型,所述第二参数模型用于识别用户提问意图;基于所述第一参数模型和所述第二参数模型生成对话。
【技术特征摘要】
1.一种对话生成方法,其特征在于,所述方法包括:获取训练对话语料以及对所述训练对话语料的第一实体标注结果;根据所述训练对话语料以及所述第一实体标注结果,训练第一参数模型;基于所述第一参数模型,对所述训练对话语料执行对话语料重组扩展处理,得到重组扩展对话语料;根据所述训练对话语料、所述第一实体标注结果、所述重组扩展对话语料以及对所述重组扩展对话语料的第二实体标注结果,训练第二参数模型,所述第二参数模型用于识别用户提问意图;基于所述第一参数模型和所述第二参数模型生成对话。2.根据权利要求1所述的方法,其特征在于,所述第一参数模型包括参数必要依赖模型以及状态跳转模型;所述根据所述训练对话语料以及所述第一实体标注结果,训练第一参数模型,包括:根据所述训练对话语料以及所述第一实体标注结果,训练用于识别对话中必要参数以及参数之间依赖关系的所述参数必要依赖模型;及根据所述训练对话语料以及所述第一实体标注结果,训练用于确定对话的状态跳转关系的所述状态跳转模型。3.根据权利要求2所述的方法,其特征在于,所述训练对话语料包含至少两个对话,每一个对话由至少一个用户问答消息和至少一个系统问答消息构成;所述根据所述训练对话语料以及所述第一实体标注结果,训练用于识别对话中必要参数以及参数之间依赖关系的所述参数必要依赖模型,包括:根据所述训练对话语料以及所述第一实体标注结果,训练条件随机场CRF模型;将所述训练对话语料拆分为至少一个系统问答消息与用户问答消息的匹配对;基于所述CRF模型,对得到的至少一个匹配对中包含的系统问答消息和用户问答消息进行分析处理,得到所述训练对话语料的目标参数序列,所述目标参数序列中包括至少一个实体参数以及所述至少一个实体参数的取值;基于所述目标参数序列,对初始参数必要依赖模型进行训练,得到训练后的所述参数必要依赖模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述训练对话语料以及所述第一实体标注结果,训练用于确定对话的状态跳转关系的所述状态跳转模型,包括:基于所述参数必要依赖模型,对所述目标参数序列进行特征抽取处理,得到所述目标参数的特征信息;及基于所述特征信息对初始状态跳转模型进行训练,得到训练后的所述状态跳转模型。5.根据权利要求2所述的方法,其特征在于,初始参数必要依赖模型为卷积神经网络CNN、长短期记忆LSTM网络以及逻辑回归LR网络中至少两个相结合的模型。6.根据权利要求2所述的方法,其特征在于,初始状态跳转模型为采用LSTM网络的模型。7.根据权利要求1所述的方法,其特征在于,所述基于所述第一参数模型,对所述训练对话语料执行对话语料重组扩展处理,得到重组扩展对话语料,包括:将所述训练对话语料拆分为至少一个系统问答消息与用户问答消息的匹配对;对于得到的至少一个匹配对,基于所述第一参数模型以及除了所述至少一个匹配对之外的其他匹配对,扩展与所述至少一个匹配对中包含的用户问答消息匹配的系统问答消息,得到所述重组扩展对话语料;所述根据所述训练对话语料、所述第一实体标注结果、所述重组扩展对话语料以及对所述重组扩展对话语料的第二实体标注结果,训练第二参数模型,包括:根据所述训练对话语料、所述第一实体标注结果、所述重组扩展训练语料以及所述第二实体标注结果,对初始第二参数模型进行训练,得到训练后的所述第二参数模型。8.根据权利要求7所述的方法,其特征在于,所述初始第二参数模型为CNN、循环神经网络RNN以及深度神经网络DNN中至少两个相结合的模型。9.根据权利要求1至8中任一权利要求所述的方法,其特征在于,所述方法还包括:收集接收到的用户问答消息以及与所述收集到的用户问答消息匹配的系统问答消息;将所述收集到的用户问答消息以及与所述收集到的用户问答消息匹配的系统问答消息作为日志进行存储。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:在接收到用户终端发送的用户问答消息后,在存储的日志中获取与所述用户问答消息匹配的第二系统问答消息,所述第二系统问答消息与所述用户问答消息的关...
【专利技术属性】
技术研发人员:陈立,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。