用于优化对话模型的方法和装置制造方法及图纸

技术编号:20866316 阅读:20 留言:0更新日期:2019-04-17 09:19
本申请实施例公开了用于优化对话模型的方法和装置。该方法的一具体实施方式包括:将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;确定回复语句与包含测试语句的对话上文的上下文连贯性分值;若连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。该实施方式提高了对话模型输出的回复语句与对话上文的连贯性。

【技术实现步骤摘要】
用于优化对话模型的方法和装置
本申请实施例涉及计算机
,具体涉及用于优化对话模型的方法和装置。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。最近几年,聊天机器人开始进入公众的视野。前沿的研究集中在聊天机器人如何根据自己的“系统画像”,表达机器人自己的一些特点,如年龄、性别等等。在与用户的交互中,机器人可以根据上文,通过匹配召回或者生成模型,产生回复内容。
技术实现思路
本申请实施例提出了用于优化对话模型的方法和装置。第一方面,本申请实施例提供了一种用于优化对话模型的方法,该方法包括:将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;确定回复语句与包含测试语句的对话上文的上下文连贯性分值;若连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。在一些实施例中,确定回复语句与包含测试语句的对话上文的上下文连贯性分值,包括:将对话上文和回复语句输入到预先训练的语义评分模型,得到回复语句与对话上文的上下文连贯性分值。在一些实施例中,语义评分模型通过如下步骤训练得到:获取训练样本集合,其中训练样本包括对话上文、回复语句以及标注信息,对话上文包括至少两个自然语句,标注信息包括训练样本中的回复语句与对话上文的上下文连贯性分值;将训练样本集合中的训练样本的对话上文和回复语句作为输入,将与输入的对话上文和回复语句对应的标注信息作为输出,训练得到语义评分模型。在一些实施例中,该方法还包括:对回复语句进行语义分析,获取回复语句隐含的用户属性信息;确定获取到的用户属性信息与预设的用户属性信息集合中的用户属性信息是否一致;若获取到的用户属性信息与用户属性信息集合中用户属性信息不一致,调整初始对话模型的模型参数,继续训练初始对话模型。在一些实施例中,该方法还包括:确定回复语句涉及的用户属性,以及统计用户属性在对话上文中被谈论的次数;若次数大于或等于预设数值,调整初始对话模型的模型参数,继续训练初始对话模型。第二方面,本申请实施例提供了一种用于生成回复语句的方法,该方法包括:接收用户输入的自然语句;将自然语句输入到对话模型中,生成回复语句,其中对话模型是采用如第一方面任一实现方式描述的方法优化的模型。在一些实施例中,将自然语句输入到对话模型中,生成回复语句,包括:从预设的用户画像集合中选取与对话记录匹配的用户画像;基于选取的用户画像确定用户的兴趣点;将自然语句输入到对话模型中,以及将兴趣点的向量表示作为对话模型的解码输入,得到用户感兴趣的回复语句。第三方面,本申请实施例提供了一种用于优化对话模型的装置,该装置包括:语句生成单元,被配置成将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;分值确定单元,被配置成确定回复语句与包含测试语句的对话上文的上下文连贯性分值;第一调整单元,被配置成若连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。在一些实施例中,分值确定单元具体被配置成:将对话上文和回复语句输入到预先训练的语义评分模型,得到回复语句与对话上文的上下文连贯性分值。在一些实施例中,语义评分模型通过如下步骤训练得到:获取训练样本集合,其中训练样本包括对话上文、回复语句以及标注信息,对话上文包括至少两个自然语句,标注信息包括训练样本中的回复语句与对话上文的上下文连贯性分值;将训练样本集合中的训练样本的对话上文和回复语句作为输入,将与输入的对话上文和回复语句对应的标注信息作为输出,训练得到语义评分模型。在一些实施例中,该装置还包括:属性信息获取单元,被配置成对回复语句进行语义分析,获取回复语句隐含的用户属性信息;信息确定单元,被配置成确定获取到的用户属性信息与预设的用户属性信息集合中的用户属性信息是否一致;第二调整单元,被配置成若获取到的用户属性信息与用户属性信息集合中用户属性信息不一致,调整初始对话模型的模型参数,继续训练初始对话模型。在一些实施例中,该装置还包括:统计单元,被配置成确定回复语句涉及的用户属性,以及统计用户属性在对话上文中被谈论的次数;第三调整单元,被配置成若次数大于或等于预设数值,调整初始对话模型的模型参数,继续训练初始对话模型。第四方面,本申请实施例提供了一种用于生成回复语句的装置,该装置包括:语句接收单元,被配置成接收用户输入的自然语句;语句生成单元,被配置成将自然语句输入到对话模型中,生成回复语句,其中对话模型是采用如第一方面任一实现方式描述的方法优化的模型。在一些实施例中,语句生成单元包括:画像选取模块,被配置成从预设的用户画像集合中选取与对话记录匹配的用户画像;兴趣点确定模块,被配置成基于选取的用户画像确定用户的兴趣点;语句生成模块,被配置成将自然语句输入到对话模型中,以及将兴趣点的向量表示作为对话模型的解码输入,得到用户感兴趣的回复语句。第五方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面或第二方面中任一实现方式描述的方法。第六方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面或第二方面中任一实现方式描述的方法。本申请实施例提供的用于优化对话模型的方法和装置,通过将测试语句输入到初始对话模型中生成回复语句,然后确定回复语句与对话上文的上下文连贯性分值,最后在连贯性分值小于预设分值时,调整初始对话模型的模型参数,继续训练初始对话模型,从而可以提高对话模型输出的回复语句与对话上文的连贯性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于优化对话模型的方法的一个实施例的流程图;图3A和图3B是根据本申请的用于优化对话模型的方法的一个应用场景的示意图;图4是根据本申请的用于生成回复语句的方法的一个实施例的流程图;图5是根据本申请的用于优化对话模型的装置的一个实施例的结构示意图;图6是根据本申请的用于生成回复语句的装置的一个实施例的结构示意图;图7是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于优化对话模型的方法、用于生成回复语句的方法、用于优化对话模型的装置或用于生成回复语句的装置的实施例的示例性系统架构100。如图1所示,系统架构1本文档来自技高网...

【技术保护点】
1.一种用于优化对话模型的方法,包括:将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;确定所述回复语句与包含所述测试语句的对话上文的上下文连贯性分值;若所述连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。

【技术特征摘要】
1.一种用于优化对话模型的方法,包括:将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;确定所述回复语句与包含所述测试语句的对话上文的上下文连贯性分值;若所述连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。2.根据权利要求1所述的方法,其中,所述确定所述回复语句与包含所述测试语句的对话上文的上下文连贯性分值,包括:将所述对话上文和所述回复语句输入到预先训练的语义评分模型,得到所述回复语句与所述对话上文的上下文连贯性分值。3.根据权利要求2所述的方法,其中,所述语义评分模型通过如下步骤训练得到:获取训练样本集合,其中训练样本包括对话上文、回复语句以及标注信息,对话上文包括至少两个自然语句,标注信息包括训练样本中的回复语句与对话上文的上下文连贯性分值;将所述训练样本集合中的训练样本的对话上文和回复语句作为输入,将与输入的对话上文和回复语句对应的标注信息作为输出,训练得到所述语义评分模型。4.根据权利要求1所述的方法,其中,所述方法还包括:对所述回复语句进行语义分析,获取所述回复语句隐含的用户属性信息;确定获取到的用户属性信息与预设的用户属性信息集合中的用户属性信息是否一致;若获取到的用户属性信息与所述用户属性信息集合中用户属性信息不一致,调整初始对话模型的模型参数,继续训练初始对话模型。5.根据权利要求1所述的方法,其中,所述方法还包括:确定所述回复语句涉及的用户属性,以及统计所述用户属性在所述对话上文中被谈论的次数;若所述次数大于或等于预设数值,调整初始对话模型的模型参数,...

【专利技术属性】
技术研发人员:鲍思琪何煌王凡吴华何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1