用于优化对话模型的方法和装置制造方法及图纸

技术编号：20866316 阅读：20 留言：0更新日期：2019-04-17 09:19

本申请实施例公开了用于优化对话模型的方法和装置。该方法的一具体实施方式包括：将测试语句输入到使用对话数据集训练出的初始对话模型，生成回复语句；确定回复语句与包含测试语句的对话上文的上下文连贯性分值；若连贯性分值小于预设分值，调整初始对话模型的模型参数，继续训练初始对话模型。该实施方式提高了对话模型输出的回复语句与对话上文的连贯性。

全部详细技术资料下载

【技术实现步骤摘要】
用于优化对话模型的方法和装置
本申请实施例涉及计算机
，具体涉及用于优化对话模型的方法和装置。
技术介绍
人工智能(ArtificialIntelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。最近几年，聊天机器人开始进入公众的视野。前沿的研究集中在聊天机器人如何根据自己的“系统画像”，表达机器人自己的一些特点，如年龄、性别等等。在与用户的交互中，机器人可以根据上文，通过匹配召回或者生成模型，产生回复内容。
技术实现思路
本申请实施例提出了用于优化对话模型的方法和装置。第一方面，本申请实施例提供了一种用于优化对话模型的方法，该方法包括：将测试语句输入到使用对话数据集训练出的初始对话模型，生成回复语句；确定回复语句与包含测试语句的对话上文的上下文连贯性分值；若连贯性分值小于预设分值，调整初始对话模型的模型参数，继续训练初始对话模型。在一些实施例中，确定回复语句与包含测试语句的对话上文的上下文连贯性分值，包括：将对话上文和回复语句输入到预先训练的语义评分模型，得到回复语句与对话上文的上下文连贯性分值。在一些实施例中，语义评分模型通过如下步骤训练得到：获取训练样本集合，其中训练样本包括对话上文、回复语句以及标注信息，对话上文包括至少两个自然语句，标注信息包括训练样本中的回复语句与对话上文的上下文连贯性分值；...

【技术保护点】
1.一种用于优化对话模型的方法，包括：将测试语句输入到使用对话数据集训练出的初始对话模型，生成回复语句；确定所述回复语句与包含所述测试语句的对话上文的上下文连贯性分值；若所述连贯性分值小于预设分值，调整初始对话模型的模型参数，继续训练初始对话模型。

【技术特征摘要】
1.一种用于优化对话模型的方法，包括：将测试语句输入到使用对话数据集训练出的初始对话模型，生成回复语句；确定所述回复语句与包含所述测试语句的对话上文的上下文连贯性分值；若所述连贯性分值小于预设分值，调整初始对话模型的模型参数，继续训练初始对话模型。2.根据权利要求1所述的方法，其中，所述确定所述回复语句与包含所述测试语句的对话上文的上下文连贯性分值，包括：将所述对话上文和所述回复语句输入到预先训练的语义评分模型，得到所述回复语句与所述对话上文的上下文连贯性分值。3.根据权利要求2所述的方法，其中，所述语义评分模型通过如下步骤训练得到：获取训练样本集合，其中训练样本包括对话上文、回复语句以及标注信息，对话上文包括至少两个自然语句，标注信息包括训练样本中的回复语句与对话上文的上下文连贯性分值；将所述训练样本集合中的训练样本的对话上文和回复语句作为输入，将与输入的对话上文和回复语句对应的标注信息作为输出，训练得到所述语义评分模型。4.根据权利要求1所述的方法，其中，所述方法还包括：对所述回复语句进行语义分析，获取所述回复语句隐含的用户属性信息；确定获取到的用户属性信息与预设的用户属性信息集合中的用户属性信息是否一致；若获取到的用户属性信息与所述用户属性信息集合中用户属性信息不一致，调整初始对话模型的模型参数，继续训练初始对话模型。5.根据权利要求1所述的方法，其中，所述方法还包括：确定所述回复语句涉及的用户属性，以及统计所述用户属性在所述对话上文中被谈论的次数；若所述次数大于或等于预设数值，调整初始对话模型的模型参数，...

【专利技术属性】
技术研发人员：鲍思琪，何煌，王凡，吴华，何径舟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人