基于人工智能的对话生成方法、装置、设备及存储介质制造方法及图纸

技术编号:22564958 阅读:28 留言:0更新日期:2019-11-16 11:57
本发明专利技术实施方式涉及智能机器人领域,公开了一种基于人工智能的对话生成方法、装置、网络设备及存储介质,该基于人工智能的对话生成方法包括:获取待回复语句,将待回复语句输入检索式模型,其中,检索式模型用于从预设的对话语料库中筛选出回应待回复语句的K个候选回复,K为正整数;获取检索式模型输出的K个候选回复,并将待回复语句和K个候选回复输入生成式模型,利用生成式模型依据待回复语句、K个候选回复及词典中各词的逆文档频率筛选出预测词,并输出利用预测词组成的预测回复;根据预测回复获取回复语句。本发明专利技术实施方式提供的基于人工智能的对话生成方法、装置、网络设备及存储介质,可以提高聊天机器人的输出精度。

Dialogue generation method, device, equipment and storage medium based on Artificial Intelligence

The embodiment of the invention relates to the field of intelligent robot, and discloses a dialogue generation method, device, network device and storage medium based on artificial intelligence. The dialogue generation method based on artificial intelligence includes: acquiring the statement to be replied, inputting the statement to be replied into the retrieval model, wherein the retrieval model is used to screen the reply to be replied from the preset dialogue corpus K candidate replies of the statement, K is a positive integer; K candidate replies output from the retrieval model are obtained, and the statements to be replied and K candidate replies are input into the generative model. The generative model is used to filter out the prediction words according to the statements to be replied, K candidate replies and the inverse document frequency of each word in the dictionary, and output the prediction replies composed of the prediction words; the prediction replies are obtained according to the prediction replies Reply statement. The dialogue generation method, device, network device and storage medium based on artificial intelligence provided by the embodiment of the invention can improve the output accuracy of the chat robot.

【技术实现步骤摘要】
基于人工智能的对话生成方法、装置、设备及存储介质
本专利技术涉及智能机器人领域,特别涉及一种基于人工智能的对话生成方法、装置、设备及存储介质。
技术介绍
聊天机器人,也称为对话系统。目前,聊天机器人目前主要有两种实现方式:一种是检索式,另一种为生成式。检索式聊天机器人指的是通过检索与匹配的方式,从已有的大量候选答案中找出最合适的答案作为输出给用户的响应;生成式聊天机器人则是通过大量对话数据来训练模型,使用时通过结合对话历史和用户输入,逐字或逐词地生成响应的句子。然而,检索式聊天机器人返回的响应往往会比较单一,无法输出答案库之外的答案,也难以结合上下文信息。生成式聊天机器人则产生的响应难以控制,也更容易出现语法错误,甚至出现一些不合适的表达。综上所述,目前聊天机器的两种实现方式的输出都不够理想,精度较低。
技术实现思路
本专利技术实施方式的目的在于提供一种基于人工智能的对话生成方法、装置、设备及存储介质,使得聊天机器人的输出精度提高。为解决上述技术问题,本专利技术的实施方式提供了一种基于人工智能的对话生成方法,包含以下步骤:获取待回复语句,将待回复语句输入检索式模型,其中,检索式模型用于从预设的对话语料库中筛选出回应待回复语句的K个候选回复,K为正整数;获取检索式模型输出的K个候选回复,并将待回复语句和K个候选回复输入生成式模型,利用生成式模型依据待回复语句、K个候选回复及词典中各词的逆文档频率筛选出预测词,并输出利用预测词组成的预测回复;根据预测回复获取回复语句。本专利技术的实施方式还提供了一种基于人工智能的对话生成装置,包含:候选回复检索模块,用于获取待回复语句,将待回复语句输入检索式模型,其中,检索式模型用于从预设的对话语料库中筛选出回应待回复语句的K个候选回复,K为正整数;预测回复获取模块,用于获取检索式模型输出的K个候选回复,并将待回复语句和K个候选回复输入生成式模型,其中,生成式模型根据待回复语句、K个候选回复及词典中各词的逆文档频率筛选出预测词,并输出利用预测词组成的预测回复;回复语句获取模块,用于根据预测回复获取回复语句。本专利技术的实施方式还提供了一种网络设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的基于人工智能的对话生成方法。本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的基于人工智能的对话生成方法。本专利技术实施方式相对于现有技术而言,通过将待回复语句输入检索式模型,可以根据检索式模型得到K个候选回复;将待回复语句和K个候选回复输入生成式模型,可以使待回复语句和检索得到的K个候选回复的信息都可以被生成式模型利用,从而使生成式模型的输出更加规范;进一步地,生成式模型在筛选预测词时结合词典中各词的逆文档频率,可以降低高频词作为回复的概率,减少万能答案的产生,从而使聊天机器人的输出精度提高。另外,在将待回复语句和K个候选回复输入生成式模型之后,还包括:对待回复语句和K个候选回复进行编码,得到待回复向量和K个候选回复向量。根据待回复向量和K个候选回复向量获取上下文向量;根据上下文向量和逆文档频率计算词典中每一词的综合得分,并获取综合得分最高的词作为预测词;获取根据预测词组成的预测回复。通过对待回复语句和K个候选回复进行编码成向量,根据编码后结果获取上下文向量,将上下文向量作为生成式模型的解码器的输入,可以优化解码器的输入,使生成型模型充分学习检索式模型检索的候选回复的信息,及待回复语句和K个候选回复的表达方式,从而使生成式模型的输出更加规范,精度更高。另外,对待回复语句和K个候选回复进行编码,包括:采用同一编码器对待回复语句和K个候选回复进行编码。通过将待回复语句和K个候选回复输入同一个生成式模型的编码器,可以使编码器充分学习待回复语句和K个候选回复的表达方式,从而优化生成式模型输出的精度,使编码器模型的模型泛化能力更强。另外,根据待回复向量和K个候选回复向量获取上下文向量,包括:将待回复向量和K个候选回复向量映射至不同的向量空间后拼接,根据拼接的结果得到上下文向量。通过将待回复向量和K个候选回复向量映射至不同向量空间,可以使生成式模型区分待回复语句和K个候选回复所传达的信息;根据拼接的结果得到上下文向量,使生成式模型利用上下文向量的信息及表达方式生成对话的回复语句,提高生成式模型的输出精度。另外,生成式模型包括第一参数矩阵和第二参数矩阵;将待回复向量和K个候选回复向量映射至不同的向量空间后拼接,根据拼接的结果得到上下文向量,包括:将待回复向量与第一参数矩阵相乘,得到变换后的待回复向量;将K个候选回复向量与第二参数矩阵相乘,得到变换后K个候选回复向量;将变换后的待回复向量与变换后的K个候选回复拼接,得到上下文向量。通过将待回复向量和K个候选回复向量分别与第一参数矩阵和第二参数矩阵相乘,可以降低K个候选回复中无意义答案的权重,提高待回复语句和K个候选回复中有意义答案的权重,优化生成式模型中解码器的输入,从而优化生成式模型的输出。另外,根据上下文向量和逆文档频率计算词典中每一词的综合得分,包括:根据以下第一计算公式计算每一词的综合得分:P(yt|yt-1,q,r)=α*softmax_score(w)+β*idf(w);其中,P(yt|yt-1,q,r)为每一词的综合得分,yt是t时刻的预测词,q为待回复语句,r为候选回复,α和β为预设生成式模型的参数,idf(w)为每一词的逆文档频率,softmax_score(w)为每一词的归一化指数函数值,用以下第二计算公式计算:其中,为t时刻生成式模型的隐藏层的输出,Cinput为上下文向量。另外,根据预测回复获取回复语句,包括:将预测回复和K个候选回复输入预设分类模型中,获取预设分类模型输出的结果作为回复语句。附图说明一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。图1是本专利技术第一实施方式中基于人工智能的对话生成方法的流程示意图;图2是本专利技术第一实施方式中基于人工智能的对话生成方法的另一流程示意图;图3是本专利技术第一实施方式中基于人工智能的对话生成方法的具体原理示例图;图4是本专利技术第二实施方式中基于人工智能的对话生成装置的模块结构图;图5是本专利技术第三实施方式中网络设备的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。本专利技术的第一实施方式涉及一种基于人工智能的对话生成方法。通过获取待本文档来自技高网...

【技术保护点】
1.一种基于人工智能的对话生成方法,其特征在于,包括:/n获取待回复语句,将所述待回复语句输入检索式模型,其中,所述检索式模型用于从预设的对话语料库中筛选出回应所述待回复语句的K个候选回复,所述K为正整数;/n获取所述检索式模型输出的K个候选回复,并将所述待回复语句和所述K个候选回复输入生成式模型,利用所述生成式模型依据所述待回复语句、所述K个候选回复及词典中各词的逆文档频率筛选出预测词,并输出利用所述预测词组成的预测回复;/n根据所述预测回复获取回复语句。/n

【技术特征摘要】
1.一种基于人工智能的对话生成方法,其特征在于,包括:
获取待回复语句,将所述待回复语句输入检索式模型,其中,所述检索式模型用于从预设的对话语料库中筛选出回应所述待回复语句的K个候选回复,所述K为正整数;
获取所述检索式模型输出的K个候选回复,并将所述待回复语句和所述K个候选回复输入生成式模型,利用所述生成式模型依据所述待回复语句、所述K个候选回复及词典中各词的逆文档频率筛选出预测词,并输出利用所述预测词组成的预测回复;
根据所述预测回复获取回复语句。


2.根据权利要求1所述的基于人工智能的对话生成方法,其特征在于,在所述将所述待回复语句和所述K个候选回复输入生成式模型之后,还包括:
对所述待回复语句和所述K个候选回复进行编码,得到待回复向量和K个候选回复向量;
根据所述待回复向量和所述K个候选回复向量获取上下文向量;
根据所述上下文向量和所述逆文档频率计算所述词典中每一词的综合得分,并获取所述综合得分最高的词作为所述预测词;
获取根据所述预测词组成的所述预测回复。


3.根据权利要求2所述的基于人工智能的对话生成方法,其特征在于,所述对所述待回复语句和所述K个候选回复进行编码,包括:
采用同一编码器对所述待回复语句和所述K个候选回复进行编码。


4.根据权利要求3所述的基于人工智能的对话生成方法,其特征在于,所述根据所述待回复向量和所述K个候选回复向量获取上下文向量,包括:
将所述待回复向量和所述K个候选回复向量映射至不同的向量空间后拼接,根据拼接的结果得到所述上下文向量。


5.根据权利要求4所述的基于人工智能的对话生成方法,其特征在于,所述生成式模型包括第一参数矩阵和第二参数矩阵;
所述将所述待回复向量和所述K个候选回复向量映射至不同的向量空间后拼接,根据拼接的结果得到所述上下文向量,包括:
将所述待回复向量与所述第一参数矩阵相乘,得到变换后的待回复向量;
将所述K个候选回复向量与所述第二参数矩阵相乘,得到变换后K个候选回复向量;
将所述变换后的待回复向量与所述变换后的K个候选回复拼接,得到所述上下文向量。


6.根据权利要求3所述的基于人工...

【专利技术属性】
技术研发人员:张世西贾志强
申请(专利权)人:深圳前海达闼云端智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1