一种语境集合与回复集合的匹配方法及装置制造方法及图纸

技术编号:21891893 阅读:25 留言:0更新日期:2019-08-17 14:30
本申请提供了一种语境集合与回复集合的匹配方法及装置,在本申请中,分别对语境集合中的各个句子中的各个语境单词分别进行编码及对回复集合中各个句子中的各个回复单词分别进行编码,在此基础上,得到语境集合中各个句子的匹配向量序列及回复集合中各个句子的匹配向量序列,并基于利用句子上下文信息表达句子的原则,分别基于语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,及分别基于回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,保证得到的目标语句匹配向量中包含有语境集合中句子与回复集合中句子之间的关系信息,将其输入分类器,可以提高匹配度的准确性,进而可以提高从回复候选集中选择回复集合的准确性。

A Matching Method and Device for Context Set and Response Set

【技术实现步骤摘要】
一种语境集合与回复集合的匹配方法及装置
本申请涉及自然语言处理
,特别涉及一种语境集合与回复集合的匹配方法及装置。
技术介绍
随着智能化技术的发展,人机对话也受到越来越多的关注。人机对话的关键在于:终端依据给定的语境从回复候选集中自动选择最匹配的回复集合。因此,如何提高回复集合的选择可靠性成为问题。
技术实现思路
为解决上述技术问题,本申请实施例提供一种语境集合与回复集合的匹配方法及装置,以达到提高从回复候选集中选择回复集合的准确性的目的,技术方案如下:一种语境集合与回复集合的匹配方法,包括:对语境集合中各个句子中的各个语境单词分别进行编码,分别得到目标语境单词,所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息;对回复集合中各个句子中的各个回复单词分别进行编码,分别得到目标回复单词,所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息;基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词,得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列;基于所述语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量,及基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量;对所述第一整合语句向量和所述第二整合语句向量进行拼接,得到目标语句匹配向量;将所述目标语句匹配向量输入分类器,得到所述分类器输出的匹配度,作为所述语境集合与所述回复集合的匹配度。一种语境集合与回复集合的匹配装置,包括:第一编码模块,用于对语境集合中各个句子中的各个语境单词分别进行编码,分别得到目标语境单词,所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息;第二编码模块,用于对回复集合中各个句子中的各个回复单词分别进行编码,分别得到目标回复单词,所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息;匹配模块,用于基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词,得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列;整合模块,用于基于所述语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量,及基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量;拼接模块,用于对所述第一整合语句向量和所述第二整合语句向量进行拼接,得到目标语句匹配向量;分类模块,用于将所述目标语句匹配向量输入分类器,得到所述分类器输出的匹配度,作为所述语境集合与所述回复集合的匹配度。与现有技术相比,本申请的有益效果为:在本申请中,基于利用单词上下文信息表达单词的原则,分别对语境集合中的各个句子中的各个语境单词分别进行编码及对回复集合中各个句子中的各个回复单词分别进行编码,在此基础上,建立语境集合与回复集合之间句子之间的关系,得到语境集合中各个句子的匹配向量序列及回复集合中各个句子的匹配向量序列,并基于利用句子上下文信息表达句子的原则,分别基于语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,及分别基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,保证得到的目标语句匹配向量中包含有语境集合中句子与回复集合中句子之间的关系信息,将包含有语境集合中句子与回复集合中句子之间的关系信息的目标语句匹配向量输入分类器,可以提高匹配度的准确性,进而可以提高从回复候选集中选择回复集合的准确性。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请提供的一种语境集合与回复集合的匹配方法的流程图;图2是本申请提供的一种得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列的流程图;图3是本申请提供的一种得到所述语境集合中各个句子的匹配向量序列的流程图;图4是本申请提供的另一种得到所述语境集合中各个句子的匹配向量序列的流程图;图5是本申请提供的一种得到所述回复集合中各个句子的匹配向量序列的流程图;图6是本申请提供的另一种得到所述回复集合中各个句子的匹配向量序列的流程示意图;图7是本申请提供的一种基于所述语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量的流程图;图8是本申请提供的一种基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量的流程图;图9是本申请提供的另一种基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量的流程图;图10是本申请提供的一种语境集合与回复集合的匹配装置的逻辑结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例公开了一种语境集合与回复集合的匹配方法,包括:对语境集合中的各个句子中的各个语境单词分别进行编码,分别得到目标语境单词,所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息;对回复集合中的各个句子中的各个回复单词分别进行编码,分别得到目标回复单词,所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息;基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词,得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列;基于所述语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,所述第一整合语句向量至少包含有所述语境集合中至少一个句子的匹配向量及其上下文信息,及基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,所述第二整合语句向量至少包含有所述回复集合中至少一个句子的匹配向量及其上下文信息;对所述第一整合语句向量和所述第二整合语句向量进行拼接,得到目标语句匹配向量;将所述目标语句匹配向量输入分类器,得到所述分类器输出的匹配度,作为所述语境集合与所述回复集合的匹配度。在本申请中,可以提高从回复候选集中选择回复集合的准确性。接下来对本申请实施例公开的语境集合与回复集合的匹配方法进行介绍,如图1所示的,为本申请提供的一种语境集合与回复集合的匹配方法实施例1的流程图,该方法应用于一计算机设备,该方法包括以下步骤:步骤S11、对语境集合中各个句子中的各个语境单词分别进行编码,分别得到目标语境单词;所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息。语境单词的上下文信息可以理解为:所述语境单词在所述语境单词所属句子中的上下文信息。如本文档来自技高网...

【技术保护点】
1.一种语境集合与回复集合的匹配方法,其特征在于,包括:对语境集合中各个句子中的各个语境单词分别进行编码,分别得到目标语境单词,所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息;对回复集合中各个句子中的各个回复单词分别进行编码,分别得到目标回复单词,所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息;基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词,得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列;基于所述语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量,及基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量;对所述第一整合语句向量和所述第二整合语句向量进行拼接,得到目标语句匹配向量;将所述目标语句匹配向量输入分类器,得到所述分类器输出的匹配度,作为所述语境集合与所述回复集合的匹配度。

【技术特征摘要】
1.一种语境集合与回复集合的匹配方法,其特征在于,包括:对语境集合中各个句子中的各个语境单词分别进行编码,分别得到目标语境单词,所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息;对回复集合中各个句子中的各个回复单词分别进行编码,分别得到目标回复单词,所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息;基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词,得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列;基于所述语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量,及基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量;对所述第一整合语句向量和所述第二整合语句向量进行拼接,得到目标语句匹配向量;将所述目标语句匹配向量输入分类器,得到所述分类器输出的匹配度,作为所述语境集合与所述回复集合的匹配度。2.根据权利要求1所述的方法,其特征在于,所述基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词,得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列,包括:基于多个所述目标语境单词,生成所述语境集合的全局向量序列,及基于多个所述目标回复单词,生成所述回复集合的全局向量序列;基于所述语境集合的全局向量序列及所述回复集合的全局向量序列,计算所述语境集合的全局向量序列中的各个词向量与所述回复集合的全局向量序列中的各个词向量之间的距离,作为软对齐值;利用所述软对齐值及所述回复集合的全局向量序列,分别计算表征所述语境集合的全局向量序列中各个词向量与所述回复集回复集合的全局向量序列中词向量之间关系的向量,作为语境对偶向量;利用所述软对齐值及所述语境集合的全局向量序列,分别计算表征所述回复集合的全局向量序列中各个词向量与所述语境集合的全局向量序列中词向量之间关系的向量,作为回复对偶向量;基于所述语境集合的全局向量序列及各个所述语境对偶向量,得到所述语境集合中各个句子的匹配向量序列;基于所述回复集合的全局向量序列及各个所述回复对偶向量,得到所述回复集合中各个句子的匹配向量序列。3.根据权利要求2所述的方法,其特征在于,所述基于所述语境集合的全局向量序列及各个所述语境对偶向量,得到所述语境集合中各个句子的匹配向量序列,包括:基于各个所述语境对偶向量,生成全局语境对偶向量序列;将所述语境集合的全局向量序列与所述全局语境对偶向量序列之差作为第一向量序列差;将所述语境集合的全局向量序列与所述全局语境对偶向量序列之乘作为第一向量序列乘;将所述语境集合的全局向量序列、所述全局语境对偶向量序列、所述第一向量序列差及所述第一向量序列乘拼接,得到语境全局向量序列;将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量序列,作为所述语境集合中各个句子的匹配向量序列;所述基于所述回复集合的全局向量序列及各个所述回复对偶向量,得到所述回复集合中各个句子的匹配向量序列,包括:基于各个所述回复对偶向量,生成全局回复对偶向量序列;将所述回复集合的全局向量序列与所述全局回复对偶向量序列之差作为第二向量序列差;将所述回复集合的全局向量序列与所述全局回复对偶向量序列之乘作为第二向量序列乘;将所述回复集合的全局向量序列、所述全局回复对偶向量序列、所述第二向量序列差及所述第二向量序列乘拼接,得到回复全局向量序列;将所述回复全局向量序列拆分为所述回复集合中各个句子对应的向量序列,作为所述回复集合中各个句子的匹配向量序列。4.根据权利要求3所述的方法,其特征在于,所述基于所述语境集合中各个句子的匹配向量序列,整合得到第一整合语句向量,包括:分别对所述语境集合中各个句子的匹配向量序列中各个词向量进行编码,编码结果组成的集合作为第一编码结果集合,所述第一编码结果集合中至少包括有所述语境集合中句子的匹配向量中的各个词向量及其上下文信息;分别对各个所述第一编码结果集合进行池化,池化的结果作为第一池化结果;分别对各个所述第一池化结果进行编码,编码结果组成的集合作为第二编码结果集合,所述第二编码结果集合至少包含有所述第一池化结果及其上下文信息;对所述第二编码结果集合进行池化,池化的结果作为第一整合语句向量。5.根据权利要求3所述的方法,其特征在于,所述基于所述回复集合中各个句子的匹配向量序列,整合得到第二整合语句向量,包括:分别对所述回复集合中各个句子的匹配向量序列中各个词向量进行编码,编码结果组成的集合作为第三编码结果集合,所述第三编码结果集合中至少包括有所述回复集合中句子的匹配向量中各个词向量及其上下文信息;分别对各个所述第三编码结果集合进行池化,池化的结果作为第二池化结果;分别对各个所述第二池化结果进行编码,编码结果组成的集合作为第四编码结果集合,所述第四编码结果集合至少包含有所述第二池化结果及其上下文信息;对所述第四编码结果集合进行池化,池化的结果作为第二整合语句向量;...

【专利技术属性】
技术研发人员:顾佳宸凌震华刘权
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1