人机对话模型训练方法、人机对话方法及系统技术方案

技术编号:24613493 阅读:24 留言:0更新日期:2020-06-24 01:08
本发明专利技术公开一种人机对话模型训练方法,所述人机对话模型包括编码器和解码器,所述方法包括:预先构建训练样本集,所述训练样本集至少基于有效问题‑答案对子集和无效问题‑答案对子集构成;采用所述训练样本集对所述编码器进行预训练得到初始编码器;采用所述训练样本集对所述初始编码器和所述解码器进行联合训练。本发明专利技术通过将无效问题融入到训练样本集中,并且基于该训练样本集对编码器进行预训练,使得训练得到的初始编码器学习到了需要进行特殊回复无效问题的特征,进一步基于训练样本集对初始编码器和解码器进行联合训练,从而得到了能够针对需要进行特殊回复的无效问句生成合适答复内容的人机对话模型。

Training method, method and system of man-machine dialogue model

【技术实现步骤摘要】
人机对话模型训练方法、人机对话方法及系统
本专利技术涉及人机对话
,尤其涉及一种人机对话模型训练方法、人机对话方法及系统。
技术介绍
当前,人机对话技术已经开始广泛地应用到人们的生活中,比如车载语音,外呼系统,智能音箱等等。但是,现在的人机闲聊技术还达不到像人一样“对答如流”,问答系统如何精细的处理“没有准备的问题”是影响用户体验的最大难题之一。例如,语音对话中同音词导致的问题“功课的公式哪个宫”,噪音导致的问题“八八八八八八一”,被要求做力所不及的事情“给我打开窗帘”等等。基于匹配技术的问答系统面对上述问题,一般采用简单粗暴的方式,即匹配不到对应的问题,一律采用盲区回复,例如“这个问题我不知道”。基于匹配的问答系统最大的优势是准确性高,能很好的回复“准备好”的问题,缺点是覆盖面小,总是回复“我不知道”会影响用户的直接体验。还有一种问答系统是基于生成式神经网络的问答系统,通过训练好的神经网络模型和用户输入,“计算”出回复内容,输出给用户。这种方式的好处是覆盖面广,付出较低的成本,就可以回复用户的各种问题。缺点是某些问题回复不准确,尤其是在语义上难以理解的问题,系统回复往往“断章取义”,影响用户体验,例如下表1所示:用户输入系统回复功课的公式哪个宫小主人,要好好做功课啊八八八八八八一八一建军节给我打开窗帘小主人不要打我啊
技术实现思路
本专利技术实施例提供一种人机对话模型训练方法、人机对话方法及系统,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种人机对话模型训练方法,所述人机对话模型包括编码器和解码器,所述方法包括:预先构建训练样本集,所述训练样本集至少基于有效问题-答案对子集和无效问题-答案对子集构成;采用所述训练样本集对所述编码器进行预训练得到初始编码器;采用所述训练样本集对所述初始编码器和所述解码器进行联合训练。第二方面,本专利技术实施例还提供一种人机对话方法,包括:接收用户输入语句;基于采用本专利技术任一实施例所述的人机对话模型训练方法训练得到的人机对话模型生成对应于所述用户输入语句的回复语句。第三方面,本专利技术实施例还提供一种人机对话系统,包括本专利技术任一实施例所述的人机对话模型训练方法训练得到的人机对话模型。第四方面,本专利技术实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本专利技术上述任一项人机对话方法。第五方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术上述任一项人机对话方法。第六方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项人机对话方法。本专利技术实施例的有益效果在于:通过将无效问题融入到训练样本集中,并且基于该训练样本集对编码器进行预训练,使得训练得到的初始编码器学习到了需要进行特殊回复无效问题的特征,进一步基于训练样本集对初始编码器和解码器进行联合训练,从而得到了能够针对需要进行特殊回复的无效问句生成合适答复内容的人机对话模型。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的人机对话模型训练方法的一实施例的流程图;图2为本专利技术的人机对话模型训练方法的另一实施例的流程图;图3为本专利技术的人机对话模型训练方法的又一实施例的流程图;图4为本专利技术的电子设备的一实施例的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本专利技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。在本专利技术中,“模块”、“装置”、“系统”等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。在人机闲聊对话过程中,机器人无条件接收用户提问,并做出回复,但是用户经常说出一些“疑难”问句,比如“我家有一把O不胜的”。这些“疑难”问句,往往导致机器人做出错误回答、“盲区”回答,或者多余回答等,大大影响了用户使用体验。本专利技术针对生成式神经网络问答系统,提出了一套“特殊”问句优化方法,使问答机器人能够自然地应对这些“疑难”问句。本专利技术公开了一种人机对话模型训练方法、人机对话方法及系统。人机对话系统可以实现为一种基于生成式神经网络闲聊问答系统,该系统包括本专利技术实施例的人机对话模型,并本文档来自技高网...

【技术保护点】
1.一种人机对话模型训练方法,所述人机对话模型包括编码器和解码器,所述方法包括:/n预先构建训练样本集,所述训练样本集至少基于有效问题-答案对子集和无效问题-答案对子集构成;/n采用所述训练样本集对所述编码器进行预训练得到初始编码器;/n采用所述训练样本集对所述初始编码器和所述解码器进行联合训练。/n

【技术特征摘要】
1.一种人机对话模型训练方法,所述人机对话模型包括编码器和解码器,所述方法包括:
预先构建训练样本集,所述训练样本集至少基于有效问题-答案对子集和无效问题-答案对子集构成;
采用所述训练样本集对所述编码器进行预训练得到初始编码器;
采用所述训练样本集对所述初始编码器和所述解码器进行联合训练。


2.根据权利要求1所述的方法,其中,所述预先构建训练样本集包括:为所述有效问题-答案对子集中的有效问题配置有效问句编码;
将所述无效问题-答案对子集中的无效问题划分为多种类型,并且相应的配置多个无效问句编码;
根据预设词典对所述有效问题-答案对子集中的有效问题和相应答案进行编码;
根据预设词典对所述无效问题-答案对子集中的无效问题和相应答案进行编码。


3.根据权利要求2所述的方法,其中,所述无效问题-答案对子集中的答案采用多种预定字符串表示,所述多种预定字符串的种类与所述无效问句编码的数量相当;
所述预设词典中包括多个功能码和无效问句标识,所述多个功能码和所述无效问句标识各自配置有设定编号。


4.根据权利要求3所述的方法,其中,所述多个功能码包括开始功能码、结束功能码、对齐功能码和替换功能码;
所述根据预设词典对所述有效问题-答案对子集中的有效问题和相应答案进行编码包括:
采用所述多个功能码对所述有效问题-答案对子集中的有效问题和相应答案进行对齐预处理;
采用所述预设词典对预处理之后的有效问题和相应答案进行编码;
所述根据预设词典对所述无效问题-答案对子集中的无效问题和相应答案进行编码包括:
采用所述多个功能码对所述无效问题-答案对子集中的无效问题和相应答案进行对齐预处理;
采用所述预设词典对预处理之后的无效问题和相应答案进行编码。


5.根据权利要求1-4中任一项所述的方法,其中...

【专利技术属性】
技术研发人员:朱钦佩
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1