对话生成方法、对话模型训练方法及装置制造方法及图纸

技术编号：35519971 阅读：43 留言：0更新日期：2022-11-09 14:38

本申请公开了对话生成方法、对话模型训练方法及装置，涉及计算机技术领域，尤其涉及自然语言处理、深度学习等人工智能领域。具体实现方案为：获取用户与目标机器人之间的历史对话和目标对话，其中，目标对话是基于目标机器人的角色信息生成的；将目标对话和历史对话输入到对话模型中，以获取对话模型输出的历史对话的回复语句；其中，回复语句为与目标机器人的角色信息匹配的语句。针对不同的机器人角色信息，该方法可以通过将基于机器人的角色信息生成的目标对话作为对话模型的输入，得到对话模型输出的与目标机器人的角色信息匹配的回复语句，从而可以得到不同设定角色信息的机器人，降低了成本。降低了成本。降低了成本。

全部详细技术资料下载

【技术实现步骤摘要】
对话生成方法、对话模型训练方法及装置

[0001]本申请涉及计算机
，尤其涉及自然语言处理、深度学习等人工智能领域，具体涉及一种对话生成方法、对话模型训练方法及装置。

技术介绍

[0002]对话机器人，或称对话系统是利用机器学习(Machine Learning，ML)和人工智能(Artificial Intelligence，AI)等技术让机器理解人的语言，进而模拟人与人之间的沟通交流。在实际应用中，不同应用场景下用户的聊天需求可能不同，针对不同的场景需要应用不同角色的对话机器人。
[0003]因此，如何降低获取不同角色对话机器人的成本是亟待解决的问题。

技术实现思路

[0004]本申请提供了一种对话生成方法、对话模型训练方法及装置。具体方案如下：
[0005]根据本申请的一方面，提供了一种对话生成方法，包括：
[0006]获取用户与目标机器人之间的历史对话和目标对话，其中，目标对话是基于目标机器人的角色信息生成的；
[0007]将目标对话和历史对话输入到对话模型中，以获取对话模型输出的历史对话的回复语句；其中，回复语句为与目标机器人的角色信息匹配的语句。
[0008]根据本申请的另一方面，提供了一种对话模型训练方法，包括：
[0009]获取训练样本，其中，训练样本包括机器人的角色信息、用户的角色信息、用户与机器人之间的历史对话和第一回复语句；
[0010]将训练样本输入到初始对话模型，以获取初始对话模型输出的历史对话的第二回复语句；r/>[0011]根据第二回复语句与第一回复语句之间的差异，对初始对话模型的参数进行调整，以得到对话模型。
[0012]根据本申请的另一方面，提供了一种对话生成装置，包括：
[0013]第一获取模块，用于获取用户与目标机器人之间的历史对话和目标对话，其中，目标对话是基于目标机器人的角色信息生成的；
[0014]第二获取模块，用于将目标对话和历史对话输入到对话模型中，以获取对话模型输出的历史对话的回复语句；其中，回复语句为与目标机器人的角色信息匹配的语句。
[0015]根据本申请的另一方面，提供了一种对话模型训练装置，包括：
[0016]第一获取模块，用于获取训练样本，其中，训练样本包括机器人的角色信息、用户的角色信息、用户与机器人之间的历史对话和第一回复语句；
[0017]第二获取模块，用于将训练样本输入到初始对话模型，以获取初始对话模型输出的历史对话的第二回复语句；
[0018]调整模块，用于根据第二回复语句与第一回复语句之间的差异，对初始对话模型
的参数进行调整，以得到对话模型。
[0019]根据本申请的另一方面，提供了一种电子设备，包括：
[0020]至少一个处理器；以及
[0021]与所述至少一个处理器通信连接的存储器；其中，
[0022]所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述实施例所述的方法。
[0023]根据本申请的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据上述实施例所述的方法。
[0024]根据本申请的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述实施例所述方法的步骤。
[0025]应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0026]附图用于更好地理解本方案，不构成对本申请的限定。其中：
[0027]图1为本申请一实施例提供的对话生成方法的流程示意图；
[0028]图2为本申请一实施例提供的对话生成过程示意图；
[0029]图3为本申请另一实施例提供的对话生成方法的流程示意图；
[0030]图4为本申请另一实施例提供的对话生成方法的流程示意图；
[0031]图5为本申请一实施例提供的对话模型训练方法的流程示意图；
[0032]图6为本申请另一实施例提供的对话模型训练方法的流程示意图；
[0033]图7为本申请一实施例提供的训练阶段对话模型输入的示意图；
[0034]图8为本申请一实施例提供的对话生成装置的结构示意图；
[0035]图9为本申请一实施例提供的对话模型训练装置的结构示意图；
[0036]图10是用来实现本申请实施例的对话生成方法的电子设备的框图。
具体实施方式
[0037]以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
[0038]人工智能是研究使用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的
也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术包括计算机视觉技术、语音识别技术、自然语言处理技术以及深度学习、大数据处理技术、知识图谱技术等几大方向。
[0039]NLP(Natural Language Processing，自然语言处理)是计算机科学领域与人工智能领域中的一个重要方向，NLP研究的内容包括但不限于如下分支领域：文本分类、信息抽取、自动摘要、智能问答、话题推荐、机器翻译、主题词识别、知识库构建、深度文本表示、命
名实体识别、文本生成、文本分析(词法、句法、语法等)、语音识别与合成等。
[0040]深度学习是机器学习领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。
[0041]下面参考附图描述本申请实施例的对话生成方法、对话模型训练方法及装置。
[0042]图1为本申请一实施例提供的对话生成方法的流程示意图。
[0043]本申请实施例的对话生成方法，可以由本申请实施例的对话生成装置执行，该装置可以配置于电子设备中，以实现根据不同的角色信息，得到不同角色的机器人。
[0044]其中，电子设备可以为任一具有计算能力的设备，例如可以为个人电脑、移动终端、服务器等，移动终端例如可以为车载设备、手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
[0045]本申请中所述的机器人可以是指对话机器人，或者具有对话功能的设备等。
[0本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种对话生成方法，包括：获取用户与目标机器人之间的历史对话和目标对话，其中，所述目标对话是基于所述目标机器人的角色信息生成的；将所述目标对话和所述历史对话输入到对话模型中，以获取所述对话模型输出的所述历史对话的回复语句；其中，所述回复语句为与所述目标机器人的角色信息匹配的语句。2.如权利要求1所述的方法，其中，在所述获取目标对话之前，还包括：获取所述目标机器人的角色信息；根据所述目标机器人的角色信息，确定所述目标机器人对应的目标角色属性及所述目标角色属性的属性值；根据所述目标角色属性及所述属性值，生成所述目标对话。3.如权利要求2所述的方法，其中，所述根据所述目标角色属性及所述属性值，生成所述目标对话，包括：获取预设的角色属性与问答语句之间的对应关系，其中，所述对应关系中每对问答语句是用于描述对应的角色属性的一组对话；根据所述目标角色属性，查询所述对应关系，以确定与所述目标角色属性对应的目标问答语句；根据所述目标问答语句及所述属性值，生成所述目标对话。4.如权利要求3所述的方法，其中，所述目标问答语句为多对，所述根据所述目标问答语句及所述属性值，生成所述目标对话，包括：将多对所述目标问答语句进行拼接，得到拼接后的问答语句；根据所述拼接后的问答语句及每对所述问答语句对应的属性值，生成所述目标对话。5.如权利要求2所述的方法，其中，所述根据所述目标角色属性及所述属性值，生成所述目标对话，包括：将所述目标角色属性与预设的语句库中的语句进行匹配，以从所述语句库中确定出与所述目标角色属性匹配的疑问语句和陈述语句；根据所述疑问语句、所述陈述语句及所述属性值，生成所述目标对话。6.如权利要求1所述的方法，其中，所述将所述目标对话和所述历史对话输入到对话模型中，以获取所述对话模型输出的所述历史对话的回复语句，包括：将所述目标对话拼接在所述历史对话之前，得到所述目标对话和所述历史对话拼接后的对话；将所述拼接后的对话输入到对话模型中，以获取所述历史对话的回复语句。7.一种对话模型训练方法，包括：获取训练样本，其中，所述训练样本包括机器人的角色信息、用户的角色信息、所述用户与所述机器人之间的历史对话和第一回复语句；将所述训练样本输入到初始对话模型，以获取所述初始对话模型输出的所述历史对话的第二回复语句；根据所述第二回复语句与所述第一回复语句之间的差异，对所述初始对话模型的参数进行调整，以得到对话模型。8.如权利要求7所述的方法，其中，所述将所述训练样本输入到初始对话模型，以获取
所述初始对话模型输出的所述历史对话的第二回复语句，包括：对所述训练样本中的各个词进行向量转化，得到所述各个词对应的第一向量表示；根据所述各个词对应的第二向量表示，确定所述训练样本对应的第二向量表示；将所述第二编码向量表示输入到所述对话初始模型中，以获取所述第二回复语句。9.如权利要求8所述的方法，其中，所述对所述训练样本中的各个词进行向量转化，得到所述各个词对应的第一向量表示，包括：对所述训练样本中的每个词进行角色编码、输入类型编码、位置编码中的至少一种编码以及词编码，得到所述每个词对应的角色向量表示、输入类型向量表示、位置向量表示中的至少一项及词向量表示；根据所述角色向量表示、所述输入类型向量表示、所述位置向量表示中的至少一项与所述词向量表示，得到所述每个词对应的第一向量表示。10.如权利要求9所述的方法，其中，所述根据所述角色向量表示、所述输入类型向量表示、所述位置向量表示中的至少一项与所述词向量表示，得到所述每个词对应的第一向量表示，包括：将所述角色向量表示、所述输入类型向量表示、所述位置向量表示中的至少一项与所述词向量表示进行相加，得到所述第一向量表示。11.如权利要求9所述的方法，其中，所述对所述训练样本中的每个词进行角色编码，包括：确定所述每个词所属的目标角色类型；根据所述目标角色类型，对所述每个词进行向量化处理，得到所述每个词对应的角色向量表示。12.如权利要求9所述的方法，其中，所述对所述训练样本中的每个词进行输入类型编码，包括：确定所述每个词所属的目标输入类型；根据所述目标输入类型，对所述每个词进行向量化处理，得到所述每个词对应的输入类型向量表示。13.一种对话生成装置，包括：第一获取模块，用于获取用户与目标机器人之间的历史对话和目标对话，其中，所述目标对话是基于所述目标机器人的角色信息生成的；第二获取模块，用于将所述目标对话和所述历史对话输入到对话模型中，以获取所述对话模型输出的所述历史对话的回...

【专利技术属性】
技术研发人员：徐新超，吴文权，牛正雨，吴华，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人