用于实现机器人聊天的训练方法、预测答案的方法及装置制造方法及图纸

技术编号:17212163 阅读:40 留言:0更新日期:2018-02-07 23:17
本公开提供了一种用于实现机器人聊天的训练方法。所述方法包括如下操作。首先,接收当前训练问题。然后,根据所述当前训练问题与N个历史问题生成训练输入向量。接着,以所述训练输入向量作为输入信息,输入至神经网络以获得所述神经网络的输出。并且,当所述神经网络的输出与标准答案不一致时,重复执行所述接收、生成、输入操作,直到所述神经网络的输出与标准答案一致时训练完成。以及存储训练完成的神经网络。本公开还提供了一种利用所述训练方法训练完成的神经网络预测答案的方法、一种用于实现机器人聊天的训练装置以及一种实现机器人聊天的装置。

Methods and devices for training and predicting answers for robot chatting

The present disclosure provides a training method for realizing robot chatting. The method includes the following operation. First, receive the current training problem. Then, the training input vector is generated according to the current training problem and the N historical problem. Then, the training input vector is used as input information and input into the neural network to obtain the output of the neural network. Moreover, when the output of the neural network is not consistent with the standard answer, the reception, generation and input operations are repeated, until the output of the neural network is consistent with the standard answers, and the training is completed. And the neural network that stores training to complete. The invention also provides a method for predicting the answer by using the training method of neural network, a training device for robot chat and a device for realizing robot chatting.

【技术实现步骤摘要】
用于实现机器人聊天的训练方法、预测答案的方法及装置
本公开涉及一种用于实现机器人聊天的训练方法、预测答案的方法及装置。
技术介绍
随着人工智能的快速发展,机器人被越来越多地应用于工农业生产、建筑、物流、和日常生活等诸多领域。对机器人的神经网络的训练是实现机器人智能化的关键。当前在进行神经网络训练时,为实现神经网络适应日常聊天的场景,有一种训练方式会将聊天内容的上下文一起作为训练输入内容,同时会给出标准答案。在训练过程中,会反复训练神经网络得到上下文以及标准答案之间较高的关联性。这样,在将训练完成的神经网络应用于聊天场景预测答案时,该训练完成的神经网络会根据用户输入的上下文从标准答案库中寻找关联性最大的答案,以此作为聊天的输出。
技术实现思路
本公开的一个方面提供了一种用于实现机器人聊天的训练方法。所述方法包括:接收当前训练问题;根据所述当前训练问题与N个历史问题生成训练输入向量,其中,所述N个历史问题是在接收所述当前训练问题之前接收到的,所述当前训练问题和N个历史问题中的每一个问题对应为所述训练输入向量中的一个元素,所述训练输入向量中的元素的顺序与所述当前训练问题和N个历史问题的接收顺序相对应,并且N为大于等于1的正整数;以所述训练输入向量作为输入信息,输入至神经网络以获得所述神经网络的输出;当所述神经网络的输出与标准答案不一致时,重复执行所述接收、生成、输入操作,直到所述神经网络的输出与标准答案一致时训练完成,其中所述标准答案为预先设置的与所述训练输入向量唯一对应的答案数据;以及存储训练完成的神经网络。可选地,所述神经网络的输出为所述神经网络从预设的答案库获取的答案数据,以及所述标准答案为所述答案库中预设设置的与所述训练输入向量唯一对应的答案数据。可选地,所述神经网络包括卷积神经网络。可选地,当在接收所述当前训练问题之前接收的问题次数小于N时,所述历史问题的个数小于N,根据所述当前训练问题与N个历史问题生成训练输入向量,包括将所述训练输入向量中没有对应的历史问题的元素设置为0。本公开的另一方面提供了一种利用上述训练方法训练完成的神经网络预测答案的方法,包括:接收当前用户输入;根据所述当前用户输入与N个历史输入生成用户输入向量,其中,所述N个历史输入是在接收所述用户输入之前接收到的,所述当前用户输入和N个历史输入中的每一个输入对应为所述用户输入向量中的一个元素,所述用户输入向量中的元素的顺序与所述当前用户输入和N个历史输入的接收顺序相对应,并且N为大于等于1的正整数;以所述用户输入向量作为输入信息,输入至所述训练完成的神经网络;以及获得所述训练完成的神经网络的输出。可选地,所述训练完成的神经网络的输出为所述训练完成的神经网络从预设的答案库中获取的答案数据。可选地,当在接收所述当前用户输入之前接收到的输入的次数小于N时,所述历史输入的个数小于N,根据所述当前用户输入与N个历史输入生成用户输入向量,包括将所述用户输入向量中没有对应的历史输入的元素设置为0。本公开的另一方面提供了一种用于实现机器人聊天的训练装置,包括训练问题接收模块、训练输入向量生成模块、训练输入向量输入模块、训练模块以及存储模块。训练问题接收模块用于接收训练问题。训练输入向量生成模块用于根据所述当前训练问题与N个历史问题生成训练输入向量,其中,所述N个历史问题是在接收所述当前训练问题之前接收到的,所述当前训练问题和N个历史问题中的每一个问题对应为所述训练输入向量中的一个元素,所述训练输入向量中的元素的顺序与所述当前训练问题和N个历史问题的接收顺序相对应,并且N为大于等于1的正整数。训练输入向量输入模块用于以所述训练输入向量作为输入信息,输入至神经网络中以获得所述神经网络的输出。训练模块用于当所述神经网络的输出与标准答案不一致时,重复执行所述接收、生成、输入操作,直到所述神经网络的输出与标准答案一致时训练完成,其中所述标准答案为预先设置的与所述训练输入向量唯一对应的答案数据。以及存储模块用于存储训练完成的神经网络。可选地,所述神经网络包括卷积神经网络。本公开的另一方面提供了一种用于实现机器人聊天的训练装置。所述装置包括信号接收器、一个或多个处理器,以及存储装置。信号接收器用于接收训练问题。存储装置用于存储一个或多个程序。其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行上述用于实现机器人聊天的训练方法。本公开的另一方面还提供了一种实现机器人聊天的装置,包括用户输入接收模块、用户输入向量生成模块、用户输入向量输入模块和预测答案获取模块。用户输入接收模块用于接收用户输入。用户输入向量生成模块用于根据所述当前用户输入与N个历史输入生成用户输入向量,其中,所述N个历史输入是在接收所述用户输入之前接收到的,所述当前用户输入和N个历史输入中的每一个输入对应为所述用户输入向量中的一个元素,所述用户输入向量中的元素的顺序与所述当前用户输入和N个历史输入的接收顺序相对应,并且N为大于等于1的正整数。用户输入向量输入模块,用于以所述用户输入向量作为输入信息,输入至根据上述训练方法训练完成的神经网络。以及预测答案获取模块用于获得所述训练完成的神经网络的输出。本公开的另一方面提供了一种实现机器人聊天的装置。所述机器人输入装置、一个或多个处理器,以及存储装置。输入装置用关于接收用户输入。存储装置用于存储一个或多个程序。其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行上述利用训练完成的神经网络预测答案的方法。附图说明为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:图1示意性示出了根据本公开实施例的用于实现机器人聊天的训练方法、训练装置、预测答案的方法以及实现机器人聊天的装置的应用场景;图2示意性示出了根据本公开实施例的用于实现机器人聊天的训练方法的流程图;图3示意性示出了根据本公开实施例的训练方法训练卷积神经网络的过程示例。图4示意性示出了根据本公开实施例的利用训练完成的神经网络预测答案的方法;图5示意性示出了根据本公开实施例的用于实现机器人聊天的训练装置的框图;图6示意性示出了根据本公开另一实施例的用于实现机器人聊天的训练装置的框图。图7示意性示出了根据本公开实施例的实现机器人聊天的装置的框图;以及图8示意性示出了根据本公开另一实施例的实现机器人聊天的装置的框图。具体实施方式以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具本文档来自技高网...
用于实现机器人聊天的训练方法、预测答案的方法及装置

【技术保护点】
一种用于实现机器人聊天的训练方法,包括:接收当前训练问题;根据所述当前训练问题与N个历史问题生成训练输入向量,其中,所述N个历史问题是在接收所述当前训练问题之前接收到的,所述当前训练问题和N个历史问题中的每一个问题对应为所述训练输入向量中的一个元素,所述训练输入向量中的元素的顺序与所述当前训练问题和N个历史问题的接收顺序相对应,并且N为大于等于1的正整数;以所述训练输入向量作为输入信息,输入至神经网络以获得所述神经网络的输出;当所述神经网络的输出与标准答案不一致时,重复执行所述接收、生成、输入操作,直到所述神经网络的输出与标准答案一致时训练完成,其中所述标准答案为预先设置的与所述训练输入向量唯一对应的答案数据;以及存储训练完成的神经网络。

【技术特征摘要】
1.一种用于实现机器人聊天的训练方法,包括:接收当前训练问题;根据所述当前训练问题与N个历史问题生成训练输入向量,其中,所述N个历史问题是在接收所述当前训练问题之前接收到的,所述当前训练问题和N个历史问题中的每一个问题对应为所述训练输入向量中的一个元素,所述训练输入向量中的元素的顺序与所述当前训练问题和N个历史问题的接收顺序相对应,并且N为大于等于1的正整数;以所述训练输入向量作为输入信息,输入至神经网络以获得所述神经网络的输出;当所述神经网络的输出与标准答案不一致时,重复执行所述接收、生成、输入操作,直到所述神经网络的输出与标准答案一致时训练完成,其中所述标准答案为预先设置的与所述训练输入向量唯一对应的答案数据;以及存储训练完成的神经网络。2.根据权利要求1所述的方法,其中:所述神经网络的输出为所述神经网络从预设的答案库获取的答案数据;以及所述标准答案为所述答案库中预设设置的与所述训练输入向量唯一对应的答案数据。3.根据权利要求1所述的方法,其中:所述神经网络包括卷积神经网络。4.根据权利要求1所述的方法,其中,当在接收所述当前训练问题之前接收的问题次数小于N时,所述历史问题的个数小于N,根据所述当前训练问题与N个历史问题生成训练输入向量包括:将所述训练输入向量中没有对应的历史问题的元素设置为0。5.一种利用权利要求1~4任意一项所述的方法训练完成的神经网络预测答案的方法,包括:接收当前用户输入;根据所述当前用户输入与N个历史输入生成用户输入向量,其中,所述N个历史输入是在接收所述用户输入之前接收到的,所述当前用户输入和N个历史输入中的每一个输入对应为所述用户输入向量中的一个元素,所述用户输入向量中的元素的顺序与所述当前用户输入和N个历史输入的接收顺序相对应,并且N为大于等于1的正整数;以所述用户输入向量作为输入信息,输入至所述训练完成的神经网络;获得所述训练完成的神经网络的输出。6.根据权利要求5所述的方法,其中:所述训练完成的神经网络的输...

【专利技术属性】
技术研发人员:郭同
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1