在人机交互环境中对输入查询生成自动响应的系统和方法技术方案

技术编号:18783099 阅读:20 留言:0更新日期:2018-08-29 06:43
本公开描述了一种用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统和方法。该系统可以包括外部存储器,在该外部存储器中,按照层次结构存储数据并将数据分离成多个段。该系统可以还包括处理器和与该处理器耦接的存储器。处理器可以执行存储器中所存储的多个模块。段识别模块可以被配置成从多个段中识别与用户输入匹配的相关段。相关数据确定模块可以被配置成确定与用户输入匹配的相关段内的相关数据。响应生成模块可以被配置成基于相关数据生成关于用户输入的响应。

【技术实现步骤摘要】
在人机交互环境中对输入查询生成自动响应的系统和方法
本文描述的本申请总体上涉及用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统和方法。
技术介绍
近来,技术先进的机器学习技术已经在众多以客户为中心的应用中得以运用。这样的应用之一是人机交互系统,在人机交互系统中机器以自然语言与人交谈。通常,这样的人机交互系统已被实现为聊天机器人。现今实现的聊天机器人主要被构建成用于问答任务。然而,已经观察到在这些聊天机器人的正常运行/性能方面存在问题。例如,这些聊天机器人经常丢失对话语境,并且倾向于反复提出相同问题或用相同答案来答复。而且,这些聊天机器人无法很好地记忆对话和终端用户。此外,一些聊天机器人是针对特定领域构建的,因此在其他领域中表现不佳。这是因为控制这些聊天机器人的底层系统无法提供用于访问系统的关于对世界和终端用户(人)的理解的大规模记忆的有效和/或高效的方式。
技术实现思路
提供本
技术实现思路
以介绍与用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统和方法相关的概念,并且在下面的具体实施方式中进一步描述这些概念。本
技术实现思路
并非意在标识出所要求保护的主题的基本特征,也非意在用于确定或限制所要求保护的主题的范围。在一种实现中,公开了一种用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统。所述系统包括:外部存储器,其中,所述外部存储器包括按照层次结构存储的数据,并且其中,所述数据被按照所述层次结构分离成多个段;处理器,所述处理器与所述外部存储器通信;以及存储器,所述存储器与所述处理器耦接,其中,所述存储器包括能够被所述处理器执行的多个模块。所述多个模块包括:段识别模块,所述段识别模块被配置成从所述多个段中识别出与用户输入匹配的相关段;相关数据确定模块,所述相关数据确定模块被配置成确定与所述用户输入匹配的所述相关段内的相关数据;以及响应生成模块,所述响应生成模块被配置成基于所述相关数据生成关于所述用户输入的响应。在另一种实现中,公开了一种用于在人机交互环境中对从用户接收的输入查询生成自动响应的方法。所述方法包括:通过外部存储器按照层次结构存储数据,其中,按照所述层次结构将所述数据分离成多个段;通过处理器从所述多个段中识别出与用户输入匹配的相关段;通过所述处理器确定与所述用户输入匹配的所述相关段内的相关数据;以及通过所述处理器基于所述相关数据生成关于所述用户输入的响应。附图说明参考附图对具体实施方式进行描述。在附图中,附图标记的最左边的数字标识该附图标记在其中首次出现的附图。在所有附图中,使用相同的附图标记来指代同样的特征和组件。图1示出了根据本申请的实施方案的用于在人机交互环境中对从用户接收的输入查询生成自动响应的与外部存储器104通信的系统101的网络实现100。图2示出了根据本申请的实施方案的系统101的组件。图3示出了根据本申请的实施方案的高维数据储存装置300,该高维数据储存装置是按照层次结构(hierarchicalstructure,分层结构、分级结构)进行存储的外部存储器104的实例。图4示出了根据本申请的实施方案的使用随机二进制投影对存储在外部存储器104中的数据进行分割的局部敏感散列技术。图5示出了根据本申请的实施方案的针对每个段的段向量。图6示出了描绘根据本申请的实施方案的段识别模块205结合高维数据储存装置300和其他组件工作的框图600。图7示出了描绘根据本申请的实施方案的相关数据确定模块206结合高维数据储存装置300和其他组件工作的框图700。图8示出了描绘根据本申请的实施方案的响应生成模块207结合高维数据储存装置300和其他组件工作的框图800。图9示出了根据本申请的实施方案的用于在人机交互环境中对从用户接收的输入查询生成自动响应的方法。图10示出了系统101的示例性实施方案,该示例性实施方案描绘了在人机交互环境中所生成的对应于从用户接收的输入查询的自动响应的实例。图11示出了根据本申请的实施方案的实现对从用户接收的输入查询生成自动响应的神经网络1100。图12示出了根据本主题的用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统101的示例性实现1200。图13示出了根据本主题的用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统101的示例性实现1300。具体实施方式整个说明书中,对“各个实施方案”、“一些实施方案”、“一个实施方案”或“实施方案”的参照意味着所描述的与实施方案有关的特定特征、结构或特性包括在至少一个实施方案中。因此,在整个说明书中的某些位置出现的措辞“在各个实施方案中”、“在一些实施方案中”、“在一个实施方案中”或“在实施方案中”不一定都指代相同的实施方案。此外,特定特征、结构或特性可以在一个或多个实施方案中以任何合适的方式组合。描述了用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统和方法。该系统可以包括按照层次结构存储数据的外部存储器。此外,可以将按照层次结构存储的数据分离成多个段。在一个实施方案中,存储在外部存储器中的数据可以包括用户语境数据(contextdata,上下文数据)和系统知识数据。在一个实施方案中,可以以多个数据向量的形式存储数据。此外,可以以多个段向量的形式存储上述多个段,使得每个段向量包括数据向量的子集。根据本申请的方面,可以使用散列技术基于一个或多个散列函数来生成每个段向量。须理解,每个散列函数可以使数据向量能够分离成多个桶。此外,每个散列函数、每个桶以及每个数据向量可以分别具有散列索引、桶索引以及数据索引,使得能够使用该散列索引、该桶索引以及该数据索引的组合来从外部存储器中取得(retrieve,取回、检索)被分离成桶的数据向量。此外,外部存储器中的每个段向量可以具有段索引,该段索引是散列索引和桶索引的级联(concatenation,串联、拼接、联结)。根据本申请的方面,可以从多个段中识别出与用户输入匹配的相关段。可以通过最初将用户输入编码成段查询向量并将每个段向量编码成段匹配向量来识别相关段。在一实施方案中,可以基于本领域已知的机器学习技术将用户输入编码成段查询向量,并且将段向量编码成段匹配向量。此外,可以使用余弦相似性计算每个段匹配向量关于段查询向量的相似性得分。最后,可以基于相似性得分计算段匹配向量中的段上的概率分布。在一实施方案中,可以使用机器学习技术中实现的SoftMax函数计算段上的概率分布。在一个实施方案中,可以使用随机抽样技术基于所计算的段上的概率分布选择相关段。在选择相关段之后,可以确定与用户输入匹配的相关段内的相关数据。可以通过最初取得与相关段对应的数据向量来确定相关数据。在一实施方案中,可以基于从相关段的段索引得出的桶索引和散列索引来取得与相关段对应的数据向量。此外,可以将用户输入编码成数据查询向量。在一实施方案中,可以基于本领域已知的机器学习技术将用户输入编码成数据查询向量。此后,可以使用余弦相似性计算数据向量中的每个条目(entry,录入项)关于数据查询向量的相似性得分。基于相似性得分,可以计算数据向量中的数据上的概率分布。此外,可以将每个数据向量编码成数据输出匹配向量。在一实施方案中,可以基于本领域已知的机器学习技术将每个数据向量编码成数据本文档来自技高网...

【技术保护点】
1.一种用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统,所述系统包括:外部存储器,其中,所述外部存储器包括按照层次结构存储的数据,并且其中,所述数据被按照所述层次结构分离成多个段;处理器,所述处理器与所述外部存储器通信;以及存储器,所述存储器与所述处理器耦接,其中,所述存储器包括能够被所述处理器执行的多个模块,所述多个模块包括:段识别模块,所述段识别模块被配置成从所述多个段中识别出与用户输入匹配的相关段;相关数据确定模块,所述相关数据确定模块被配置成确定与所述用户输入匹配的所述相关段内的相关数据;以及响应生成模块,所述响应生成模块被配置成基于所述相关数据生成关于所述用户输入的响应。

【技术特征摘要】
2016.12.13 US 15/376,7051.一种用于在人机交互环境中对从用户接收的输入查询生成自动响应的系统,所述系统包括:外部存储器,其中,所述外部存储器包括按照层次结构存储的数据,并且其中,所述数据被按照所述层次结构分离成多个段;处理器,所述处理器与所述外部存储器通信;以及存储器,所述存储器与所述处理器耦接,其中,所述存储器包括能够被所述处理器执行的多个模块,所述多个模块包括:段识别模块,所述段识别模块被配置成从所述多个段中识别出与用户输入匹配的相关段;相关数据确定模块,所述相关数据确定模块被配置成确定与所述用户输入匹配的所述相关段内的相关数据;以及响应生成模块,所述响应生成模块被配置成基于所述相关数据生成关于所述用户输入的响应。2.根据权利要求1所述的系统,其中,所述数据包括用户语境数据和系统知识数据,其中,基于用户对话历史、用户简档以及任何其他用户相关的信息生成所述用户语境数据。3.根据权利要求2所述的系统,其中,以多个数据向量的形式存储所述数据,并且其中,以多个段向量的形式存储所述多个段,使得每个段向量包括数据向量的子集。4.根据权利要求3所述的系统,其中,通过散列技术基于一个或多个散列函数生成每个段向量,其中,每个散列函数使数据向量能够分离成多个桶,并且其中,每个散列函数、每个桶以及每个数据向量分别具有散列索引、桶索引以及数据索引,使得能够使用所述散列索引、所述桶索引以及所述数据索引的组合从所述外部存储器中取得被分离成桶的数据向量,以及其中,每个段向量具有段索引,所述段索引是所述散列索引和所述桶索引的级联。5.根据权利要求4所述的系统,其中,所述段识别模块通过以下方式识别所述相关段:将所述用户输入编码成段查询向量;将每个段向量编码成段匹配向量;使用余弦相似性计算每个段匹配向量关于所述段查询向量的相似性得分;以及基于所述相似性得分计算所述段匹配向量中的段上的概率分布,从而选择所述相关段,其中,基于随机抽样技术选择所述相关段。6.根据权利要求5所述的系统,其中,将所述用户输入编码成段查询向量以及将所述段向量编码成段匹配向量是基于机器学习型人造神经网络(ANN)技术的,并且其中,使用机器学习技术中实现的SoftMax函数计算所述段上的概率分布。7.根据权利要求5所述的系统,其中,所述相关数据确定模块通过以下方式确定所述相关段内的所述相关数据:取得对应于所述相关段的数据向量;将所述用户输入编码成数据查询向量;使用余弦相似性计算所述数据向量中的每个条目关于所述数据查询向量的相似性得分;基于所述相似性得分计算所述数据向量中的数据上的概率分布;将每个数据向量编码成数据输出匹配向量;基于所计算的所述数据上的概率分布计算每个数据输出匹配向量中的条目的加权和;以及基于每个数据输出匹配向量中的条目的加权和来获得数据输出向量。8.根据权利要求7所述的系统,其中,基于从所述相关段的所述段索引得出的所述桶索引和所述散列索引来取得对应于所述相关段的所述数据向量。9.根据权利要求7所述的系统,其中,将所述用户输入编码成数据查询向量以及将每个数据向量编码成数据输出匹配向量是基于机器学习型人造神经网络(ANN)技术的,并且其中,使用机器学习技术中实现的SoftMax函数计算所述数据上的概率分布。10.根据权利要求7所述的系统,其中,所述响应生成模块通过以下方式基于所述相关数据生成所述响应:使用所述数据输出向量和所述数据查询向量将所述数据输出向量解码成相关输出向量;以及将所述相关输出向量转换成输出预测上的概率分布,以预测指示所生成的关于所述用户输入的响应的相关输出。11.根据权利要求10所述的系...

【专利技术属性】
技术研发人员:张子良何宇晖
申请(专利权)人:卡米人工智能有限公司
类型:发明
国别省市:英国,GB

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1