【技术实现步骤摘要】
生成式多轮闲聊对话方法、系统及计算机可读存储介质
本专利技术涉及一种生成式多轮闲聊对话方法、系统及计算机可读存储介质。
技术介绍
对话系统,也被称为智能对话体或者聊天机器人,已经被广泛应用于各种生活场景中,包括客服、娱乐闲聊、情感陪护、知识共享等等。从用途上,对话系统可以大致分为闲聊对话系统和以任务为导向的对话系统。从技术上,对话系统可以分为基于规则、基于检索、基于生成的对话系统,其中,基于规则的对话系统需要耗费大量的人力资源来设计规则,基于检索的对话系统严重依赖于语料库的质量和大小,并且基于规则或者检索的对话系统严重限制了生成回复的多样性。基于生成的对话系统能够生成更灵活的回复,也是近年来研究人员重点努力的一个方向。基于生成的闲聊对话系统包括单轮对话闲聊系统和多轮对话闲聊系统。单轮对话的闲聊系统主要的实现技术是基于编码器-译码器框架,利用人人对话语料来训练一个神经网络,将对话语料组织成提问-回复对,将提问、回复分别作为模型的输入和输出来训练网络模型。单轮对话系统面临的一个问题是模型忽略了对话历史对当前回复的影响。虽然有很多研究工作提高了多轮对话闲聊系统的表现,但 ...
【技术保护点】
1.一种生成式多轮闲聊对话方法,其特征是,分为两个阶段:阶段一:利用语料库的对话,对多轮闲聊对话模型进行训练;阶段二:将用户已经发生的对话或新提出的待答复的问题作为对话历史输入到训练好的多轮闲聊对话模型中,输出实际答复。
【技术特征摘要】
1.一种生成式多轮闲聊对话方法,其特征是,分为两个阶段:阶段一:利用语料库的对话,对多轮闲聊对话模型进行训练;阶段二:将用户已经发生的对话或新提出的待答复的问题作为对话历史输入到训练好的多轮闲聊对话模型中,输出实际答复。2.如权利要求1所述的一种生成式多轮闲聊对话方法,其特征是,所述利用语料库的对话,对多轮闲聊对话模型进行训练,包括:步骤(1):构建多轮闲聊对话模型,所述多轮闲聊对话模型包括:关键词抽取模块、宽度通道、全局通道、深度通道和解码器;所述宽度通道和深度通道并列设置,全局通道的输出分别作为宽度通道和深度通道的输入;所述宽度通道内设置有基于注意力机制的循环神经网络;所述全局通道内设置编码器;所述深度通道内设置深度神经网络;所述宽度通道和深度通道的输入端均与关键词抽取模块连接;所述宽度通道、全局通道和深度通道的输出端均与解码器连接,所述解码器内设有基于注意力机制的循环神经网络;步骤(2):将语料库中的对话分为历史对话和当前答复,所述历史对话和当前答复是相对而言的,所述历史对话,是指当前答复之前的对话内容;历史对话发生的时刻在当前答复发生的时刻之前;所述历史对话包括已知的若干组对话;然后,抽取历史对话的关键词;步骤(3):将语料库中的历史对话输入到全局通道的编码器中进行编码,生成上下文向量;步骤(4):将步骤(2)得到的历史对话的关键词和步骤(3)得到的上下文向量,输入到宽度通道的基于注意力机制的循环神经网络,输出用来拓宽话题的预测关键词,并将预测关键词编码为对应的预测关键词的编码向量;步骤(5):将步骤(2)得到的历史对话的关键词和步骤(3)得到的上下文向量,输入到深度通道的深度神经网络,输出历史对话中关键词的权重,基于权重得到加权后的历史对话关键词编码向量;步骤(6):将步骤(3)得到的上下文向量、步骤(4)得到的预测关键词的编码向量和步骤(5)得到的加权后的历史对话关键词编码向量均输入到解码器的基于注意力机制的循环神经网络中,输出回复结果;步骤(7):将步骤(6)得到的回复结果,与步骤(2)中的当前回复进行比较,计算交叉熵,得到损失函数,利用梯度下降算法对多轮闲聊对话模型进行优化,得到训练好的多轮闲聊对话模型。3.如权利...
【专利技术属性】
技术研发人员:王文杰,聂礼强,黄民烈,宋雪萌,王英龙,
申请(专利权)人:山东大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。