Systems and methods provide media guide applications for identifying multiple natural language search queries used to identify search results sets. For example, users may want to determine when the Yankees team will play their next baseball game. Users can build their queries in many ways, such as \When are the Yankees playing?\ \What time is the Yankees game?\ \When is the next Yankees baseball game?\. No matter how the query is constructed, users expect the same result, that is, the description of Yankees team's game time. Systems and methods enable users to search items or information using multiple search queries to achieve desired results.
【技术实现步骤摘要】
【国外来华专利技术】自然语言查询的近似模板匹配
技术介绍
在常规系统中,用户可以访问各种各样的媒体和信息,诸如电视节目和体育得分。用户常常可以希望使用免提接口(诸如使用语音控制)搜索信息。常规系统可以允许用户使用语音命令执行搜索。但是,这些系统通常仅辨别固定数量的搜索查询,因为输入语音搜索直接与固定查询本身匹配。因此,用户必须以特定方式构建其语音命令,以便系统可以辨别它。这常常要求用户以他们觉得不自然的方式说话。在许多情况下,用户必须在使用系统之前查找或了解需要如何构建命令。如果语音命令没有被构建成使得系统可以辨别它,那么可以提示用户以被系统辨别的方式重复命令和/或可以不呈现搜索结果。
技术实现思路
因而,本文描述了用于媒体指南系统的方法和系统,该媒体指南系统将多个自然语言查询辨别为具有类似意图并提供与该意图匹配的搜索结果。用户可以希望使用各种不同的语言来构建查询,诸如对比赛时间表的查询。例如,用户可以想要确定Yankees队何时进行他们的下一场棒球比赛。用户可以将他们的查询构建为“WhenaretheYankeesplaying?”或“WhattimeistheYankeesgame?”、“WhenisthenextYankeesbaseballgame?”。媒体指南应用可以确定,对于上述三个示例性查询中的每一个,用户都是试图确定Yankees队何时进行他们的下一场比赛。因而,媒体指南应用可以向数据库查询下一场Yankees队比赛并且可以向用户呈现查询的结果。例如,媒体指南应用可以处理来自搜索查询的词并将该词映射到向量空间,其中具有相似含义的词比不具有相似含义的词更紧密地映射在一起。 ...
【技术保护点】
1.一种用于执行搜索的方法,所述方法包括:经由用户输入设备接收输入查询,其中输入查询包括至少两个词;计算与输入查询的第一个词对应的第一表示向量和与输入查询的第二个词对应的第二表示向量,其中第一表示向量和第二表示向量的相应值与第一个词和第二个词分别与词特征集合的特征匹配的程度对应;从数据库中检索与搜索意图有关的搜索查询模板,其中搜索查询模板包括至少两个词并且与第三表示向量和第四表示向量相关联,第三表示向量和第四表示向量具有与搜索查询模板的第三个词和搜索查询模板的第四个词分别与词特征集合的特征匹配的程度对应的相应值;计算第一表示向量和第三表示向量之间的第一距离;响应于确定第一距离小于第一阈值距离,计算第二表示向量和第四表示向量之间的第二距离;以及响应于确定第二距离小于第二阈值距离:选择搜索查询模板;基于所选择的搜索查询模板来检索搜索结果;以及生成检索到的搜索结果以供显示。
【技术特征摘要】
【国外来华专利技术】2016.06.20 US 15/187,0291.一种用于执行搜索的方法,所述方法包括:经由用户输入设备接收输入查询,其中输入查询包括至少两个词;计算与输入查询的第一个词对应的第一表示向量和与输入查询的第二个词对应的第二表示向量,其中第一表示向量和第二表示向量的相应值与第一个词和第二个词分别与词特征集合的特征匹配的程度对应;从数据库中检索与搜索意图有关的搜索查询模板,其中搜索查询模板包括至少两个词并且与第三表示向量和第四表示向量相关联,第三表示向量和第四表示向量具有与搜索查询模板的第三个词和搜索查询模板的第四个词分别与词特征集合的特征匹配的程度对应的相应值;计算第一表示向量和第三表示向量之间的第一距离;响应于确定第一距离小于第一阈值距离,计算第二表示向量和第四表示向量之间的第二距离;以及响应于确定第二距离小于第二阈值距离:选择搜索查询模板;基于所选择的搜索查询模板来检索搜索结果;以及生成检索到的搜索结果以供显示。2.如权利要求1所述的方法,其中计算第一表示向量和第三表示向量之间的距离包括:将第一表示向量中的第一值与第二表示向量中的对应的第二值进行比较,以确定第一值与第二值是否相差小于阈值;响应于确定值相差小于阈值,保持距离不变;以及响应于确定值相差不小于阈值,计算值不相似的程度并基于值不相似的程度来递增距离。3.如权利要求1所述的方法,其中计算第一表示向量和第三表示向量之间的第一距离是基于在向量空间中第一表示向量相对于第三表示向量的朝向,使得第一距离是第一表示向量和第三表示向量之间的角度的量度。4.如权利要求1所述的方法,其中用户输入是经由音频输入设备处的音频信号接收的,并且其中第一个词和第二个词是通过对音频信号执行语音到文本处理而从音频信号生成的。5.如权利要求1所述的方法,还包括将来自输入查询的两个词之一包括在对数据库的查询中。6.如权利要求5所述的方法,还包括:识别与第一个词相关联的词性;以及响应于确定第一个词是输入查询的主语,将第一个词包括在对数据库的查询中。7.如权利要求1所述的方法,还包括:将第一个词与停止词列表进行比较,以确定第一个词是否与停止词列表中的停止词匹配;以及响应于确定第一个词与停止词匹配:选择输入查询的第三个词;以及计算第五表示向量,其中第一表示向量的值与输入查询的第三个词与词特征集合的特征匹配的程度对应。8.如权利要求1所述的方法,其中,当第一个词与第三个词的含义匹配并且与第四个词的含义不匹配时,第一距离小于第一表示向量和第四表示向量之间的第三距离。9.如权利要求1所述的方法,其中搜索查询模板是第一搜索查询模板,还包括:响应于确定第一距离大于第一阈值距离:从数据库检索第二搜索查询模板,其中第二搜索查询模板与第五表示向量和第六表示向量相关联,第五表示向量和第六表示向量具有与第二搜索查询模板的第一个词和第二搜索查询模板的第二个词分别与词特征集合的特征匹配的程度对应的相应值;以及计算第一表示向量和第五表示向量之间的第三距离;以及响应于确定第三距离小于第一阈值距离,计算第二表示向量和第六表示向量之间的第四距离;以及响应于确定第四距离小于第二阈值,选择第二搜索查询模板以检索搜索结果。10.如权利要求1所述的方法,其中生成检索到的搜索结果以供显示还包括:从与搜索查询模板相关联的数据库中检索布局;以及基于该布局生成检索到的搜索结果以供显示。11.一种系统,包括被配置为执行搜索的控制电路系统,其中该控制电路系统被配置为:经由用户输入设备接收输入查询,其中输入查询包括至少两个词;计算与输入查询的第一个词对应的第一表示向量和与输入查询的第二个词对应的第二表示向量,其中第一表示向量和第二表示向量的相应值与第一个词和第二个词分别与词特征集合的特征匹配的程度对应;从数据库中检索与搜索意图有关的搜索查询模板,其中搜索查询模板包括至少两个词并且与第三表示向量和第四表示向量相关联,第三表示向量和第四表示向量具有与搜索查询模板的第三个词和搜索查询模板的第四个词分别与词特征集合的特征匹配的程度对应的相应值;计算第一表示向量和第三表示向量之间的第一距离;响应于确定第一距离小于第一阈值距离,计算第二表示向量和第四表示向量之间的第二距离;以及响应于确定第二距离小于第二阈值距离:选择搜索查询模板;基于所选择的搜索查询模板来检索搜索结果;以及生成检索到的搜索结果以供显示。12.如权利要求11所述的系统,其中控制电路系统还被配置为,当计算第一表示向量和第三表示向量之间的距离时:将第一表示向量中的第一值与第二表示向量中的对应的第二值进行比较,以确定第一值与第二值是否相差小于阈值;响应于确定值相差小于阈值,保持距离不变;以及响应于确定值相差不小于阈值,计算值不相似的程度并基于值不相似的程度来递增距离。13.如权利要求11所述的系统,其中控制电路系统还被配置为,当计算第一表示向量和第三表示向量之间的第一距离时,使第一距离基于在向量空间中第一表示向量相对于第三表示向量的朝向,使得第一距离是第一表示向量和第三表示向量之间的角度的量度。14.如权利要求11所述的系统,其中用户输入是经由音频输入设备处的音频信号接收的,并且其中第一个词和第二个词是通过对音频信号执行语音到文本处理而从音频信号生成的。15.如权利要求11所述的系统,其中控制电路系统还被配置为将来自输入查询的两个词之一包括在对数据库的查询中。16.如权利要求15所述的系统,其中控制电路系统还被配置为:识别与第一个词相关联的词性;以及响应于确定第一个词是输入查询的主语,将第一个词包括在对数据库的查询中。17.如权利要求11所述的系统,其中控制电路系统还被配置为:将第一个词与停止词列表进行比较,以确定第一个词是否与停止词列表中的停止词匹配;以及响应于确定第一个词与停止词匹配:选择输入查询的第三个词;以及计算第五表示向量,其中第一表示向量的值与输入查询的第三个词与词特征集合的特征匹配的程度对应。18.如权利要求11所述的系统,其中,当第一个词与第三个词的含义匹配并且与第四个词的含义不匹配时,第一距离小于第一表示向量和第四表示向量之间的第三距离。19.如权利要求11所述的系统,其中搜索查询模板是第一搜索查询模板,并且其中控制电路系统还被配置为:响应于确定第一距离大于第一阈值距离:从数据库检索第二搜索查询模板,其中第二搜索查询模板与第五表示向量和第六表示向量相关联,第五表示向量和第六表示向量具有与第二搜索查询模板的第一个词和第二搜索查询模板的第二个词分别与词特征集合的特征匹配的程度对应的相应值;以及计算第一表示向量和第五表示向量之间的第三距离;以及响应于确定第三距离小于第一阈值距离,计算第二表示向量和第六表示向量之间的第四距离;以及响应于确定第四距离小于第二阈值,选择第二搜索查询模板以检索搜索结果。20.如权利要求11所述的系统,其中控制电路系统还被配置为,当生成检索到的搜索结果以供显示时:从与搜索查询模板相关联的数据库中检索布局;以及基于该布局生成检索到的搜索结果以供显示。21.一种用于执行搜索的系统,该系统包括:用于经由用户输入设备接收输入查询的装置,其中输入查询包括至少两个词;用于计算与输入查询的第一个词对应的第一表示向量和与输入查询的第二个词对应的第二表示向量的装置,其中第一表示向量和第二表示向量的相应值与第一个词和第二个词分别与词特征集合的特征匹配的程度对应;用于从数据库中检索与搜索意图有关的搜索查询模板的装置,其中搜索查询模板包括至少两个词并且与第三表示向量和第四表示向量相关联,第三表示向量和第四表示向量具有与搜索查询模板的第三个词和搜索查询模板的第四个词分别与词特征集合的特征匹配的程度对应的相应值;用于计算第一表示向量和第三表示向量之间的第一距离的装置;响应于确定第一距离小于第一阈值距离,用于计算第二表示向量和第四表示向量之间的第二距离的装置;以及响应于确定第二距离小于第二阈值距离:用于选择搜索查询模板的装置;用于基于所选择的搜索查询模板来检索搜索结果的装置;以及用于生成检索到的搜索结果以供显示的装置。22.如权利要求21所述的系统,其中用于计算第一表示向量和第三表示向量之间的距离的装置还包括:用于将第一表示向量中的第一值与第二表示向量中的对应的第二值进行比较,以确定第一值与第二值是否相差小于阈值的装置;响应于确定值相差小于阈值,用于保持距离不变的装置;以及响应于确定值相差不小于阈值,用于计算值不相似的程度并基于值不相似的程度来递增距离的装置。23.如权利要求21所述的系统,其中用于计算第一表示向量和第三表示向量之间的第一距离的装置还包括用于使第一距离基于在向量空间中第一表示向量相对于第三表示向量的朝向,使得第一距离是第一表示向量和第三表示向量之间的角度的量度的装置。24.如权利要求21所述的系统,还包括用于经由音频输入设备处的音频信号接收用户输入的装置,以及用于通过对音频信号执行语音到文本处理而从音频信号生成第一个词和第二个词的装置。25.如权利要求21所述的系统,还包括用于将来自输入查询的两个词之一包括在对数据库的查询中的装置。26.如权利要求25所述的系统,还包括:用于识别与...
【专利技术属性】
技术研发人员:S·万卡塔拉曼,M·马尔霍特拉,A·N·莫海迪恩匹,
申请(专利权)人:乐威指南公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。