当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于使用搜索查询信息的言语识别处理的方法和系统技术方案

技术编号:15642588 阅读:135 留言:0更新日期:2017-06-16 16:05
本申请涉及用于使用搜索查询信息的言语识别处理的方法和系统。描述了用于言语识别处理的方法和系统。在示例中,计算装置可被配置为接收指示搜索查询向用于所述搜索查询的搜索引擎的提交频率的信息,所述搜索查询由词序列组成。基于搜索查询的提交频率超过阈值,计算装置可被配置为基于该搜索查询的一个或多个词出现于该搜索查询的词序列中的顺序来确定所述一个或多个词的分组。另外,计算装置可被配置为将指示所述分组的信息提供给言语识别系统。

【技术实现步骤摘要】
用于使用搜索查询信息的言语识别处理的方法和系统分案说明本申请属于申请日为2013年10月14日的中国专利技术专利申请201380064902.5的分案申请。相关申请的交叉引用本申请要求2013年3月15日提交的并且题为“MethodsAndSystemsForSpeechRecognitionProcessingUsingSearchQueryInformation”的美国专利申请序列号13/832,136的优先权,它是2012年10月18日提交的并且题为“MethodsandSystemsforSpeechRecognitionProcessingUsingSearchQueryInformation”的美国专利申请序列号61/715,365的非临时申请,所有这些专利申请在此通过引用并入本文,如同在本说明书中充分阐述一样。
技术介绍
自动言语识别(ASR)技术可用于将音频话语映射至那些话语的文本表示。一些ASR系统使用“训练”,其中个体说话人将文本段读入到言语识别系统中。这些系统分析人的特定语音并且使用该语音来精细调节对该人的言语的识别,从而得到更准确的转录。不使用训练的系统可被称作“说话人无关”的系统。使用训练的系统可被称作“说话人有关”的系统。
技术实现思路
本申请公开了用于言语识别处理的系统和方法。在一个方面,描述了一种方法。该方法可包括在计算装置处接收指示搜索查询向搜索引擎的提交频率的信息。所述搜索查询可包括词序列。所述方法还可包括基于所述搜索查询的提交频率超过阈值,针对所述搜索查询的所述词序列基于所述搜索查询的一个或多个词出现于所述搜索查询的所述词序列中的顺序来确定所述一个或多个词的分组。所述方法还可包括将指示所述分组的信息提供给言语识别系统以更新给定词序列的语料库。所述言语识别系统可被配置为基于给定词序列的语料库将给定说出话语转换为给定词序列。在另一方面,描述了一种其上存储有指令的计算机可读介质,所述指令在由计算装置执行时使得所述计算装置执行功能。所述功能可包括接收指示搜索查询向搜索引擎的提交频率的信息。所述搜索查询可包括词序列。所述功能还可包括基于所述搜索查询的提交频率超过阈值,针对所述搜索查询的所述词序列,基于所述搜索查询的一个或多个词出现于所述搜索查询的所述词序列中的顺序来确定所述一个或多个词的分组。所述功能还可包括将指示所述分组的信息提供给言语识别系统以更新给定词序列的语料库。所述言语识别系统可被配置为基于给定词序列的语料库将给定说出话语转换为给定词序列。在另一方面,描述了一种装置。所述装置可包括至少一个处理器。所述装置还可包括数据存储装置以及该数据存储装置中的程序指令,所述程序指令在由所述至少一个处理器执行时使得所述装置接收指示搜索查询向搜索引擎的提交频率的信息。所述搜索查询可包括词序列。所述数据存储装置中的程序指令在由所述至少一个处理器执行时还使得所述装置基于所述搜索查询的提交频率超过阈值,针对所述搜索查询的所述词序列基于所述搜索查询的一个或多个词出现于所述搜索查询的所述词序列中的顺序来确定所述一个或多个词的分组。所述数据存储装置中的程序指令在由所述至少一个处理器执行时还使得所述装置将指示所述分组的信息提供给言语识别系统以更新给定词序列的语料库。所述言语识别系统可被配置为基于给定词序列的语料库将给定说出话语转换为给定词序列。所述言语识别系统还可包括所述语料库的给定词序列的出现概率。以上
技术实现思路
仅是例示性的,而非意在以任何方式限制。除了例示方面以外,上述实施例和特征,另外的方面、实施例和特征将通过参照附图以及以下具体实施方式而变得显而易见。附图说明图1图示出依据示例实施例的示例自动言语识别(ASR)系统。图2图示出依据实施例的示例声学模型的各方面。图3图示出依据实施例的ASR系统的示例搜索图。图4是依据实施例的用于言语识别处理的示例方法的流程图。图5A图示出依据实施例的示例搜索查询的示例自动机表示。图5B图示出依据实施例的示例搜索查询的示例bi-gram语言模型。图5C图示出依据实施例的示例搜索查询的示例因子图。图6图示出依据示例实施的示例分布式计算架构。图7A是依据示例实施例图示的示例计算装置的框图。图7B示出依据示例实施例的基于云的服务器系统。图8是图示出根据本文所呈现的至少一些实施例布置的示例计算机程序产品的局部概念图的示意图,该计算机程序产品包括用于在计算装置上执行计算机处理的计算机程序。具体实施方式以下具体实施方式参照附图描述了所公开的系统和方法的各种特征和功能。在附图中,除非上下文另外指示,否则相似的标号标识相似的组件。本文所描述的例示系统和方法实施例并非意在限制。可容易地理解,所公开的系统和方法的某些方面可按照各种各样的不同配置来布置和组合,其全部在本文中被预期。随着计算能力不断增加,自动言语识别(ASR)系统和装置可被部署在各种环境中以提供基于言语的用户接口。这些环境中的一些包括住宅、企业、车辆等。例如,在住宅和企业中,ASR可对诸如大家电(例如,烤箱、冰箱、洗碗机、洗衣机和烘干机)、小家电(例如,烤面包机、恒温器、咖啡机、微波炉)和媒体装置(立体声、电视、数字视频记录器、数字视频播放器)的装置以及门、灯、窗帘等提供语音控制。在车辆中,ASR可提供通信技术(例如,蜂窝电话)、媒体装置(例如,收音机和视频播放器)、地图技术(例如,导航系统)、环境控制(例如,供热装置和空调)等的免提使用。在示例中,ASR可用于将语音搜索查询转换为文本串,该文本串可被发送给搜索引擎以获得搜索结果。语音控制的潜在用途有许多,并且这些示例不应被视为限制。在示例中,可在从说话人接收话语的装置处执行ASR。对于此基于装置的ASR,每个用户装置可配置有ASR模块。在另一示例中,可在远程网络服务器(例如,互联网上的服务器或者服务器集群)处执行言语识别。尽管在此示例中言语识别可能没有将ASR并入用户装置中,但是用户装置仍可被配置为具有与远程ASR系统的通信路径(例如,通过互联网接入)。在另一示例中,言语识别可通过使用本地ASR系统来执行,该本地ASR系统将ASR的至少一些方面的执行卸下给远程装置。本地ASR系统可以是执行ASR的专用装置或者被配置为例如在通用计算平台上操作的软件。该本地ASR系统可在物理上位于住宅、企业、车辆等中,并且即使用户装置没有互联网接入也可操作。在一些示例中,用户装置可从说话人接收话语并且将话语的表示发送给本地ASR系统。本地ASR系统可将话语的表示转录为话语的文本表示,并且将该文本表示发送给用户装置。另选地,本地ASR系统作为替代可基于话语的转录将命令发送给用户装置。此命令可基于话语的转录的文本表示,或者可从话语的表示更直接地导出。所述命令还可以是用户装置所支持的命令集或命令语言。在一个示例中,话语可表示语音搜索查询,并且本地ASR系统可被配置为将语音搜索查询的转录发送给搜索引擎,以获得可通信给用户装置的相应的搜索结果。图1图示出依据实施例的示例ASR系统。在运行时,ASR系统的输入可包括话语100,并且输出可包括一个或多个文本串以及可能关联的置信度101。ASR系统的组件可包括可被配置为生成特征向量104的特征分析模块102、模式分类模块106、声学模型108、字典11本文档来自技高网
...
用于使用搜索查询信息的言语识别处理的方法和系统

【技术保护点】
一种用于言语识别处理的方法,包括:在计算装置处接收指示包括词序列的搜索查询的流行度的信息;基于所述信息确定词的一个或多个子序列,每个子序列包括基于顺序的所述搜索查询的一个或多个词,所述一个或多个词以所述顺序出现于所述搜索查询的所述词序列中;以及提供指示词的所述一个或多个子序列的信息以更新言语识别系统,所述言语识别系统被配置为将给定说出话语转换为给定词序列。

【技术特征摘要】
2012.10.18 US 61/715,365;2013.03.15 US 13/832,1361.一种用于言语识别处理的方法,包括:在计算装置处接收指示包括词序列的搜索查询的流行度的信息;基于所述信息确定词的一个或多个子序列,每个子序列包括基于顺序的所述搜索查询的一个或多个词,所述一个或多个词以所述顺序出现于所述搜索查询的所述词序列中;以及提供指示词的所述一个或多个子序列的信息以更新言语识别系统,所述言语识别系统被配置为将给定说出话语转换为给定词序列。2.根据权利要求1所述的方法,其中,所述搜索查询包括以下中的一个或多个:文本串和语音搜索查询。3.根据权利要求1所述的方法,其中,所述言语识别系统被配置为包括给定词序列的出现概率,并且其中,提供指示词的所述一个或多个子序列的所述信息以更新所述言语识别系统包括:基于所述一个或多个子序列和指示所述搜索查询的所述流行度的所述信息来更新所述出现概率。4.根据权利要求3所述的方法,其中,提供指示词的所述一个或多个子序列的所述信息来更新所述言语识别系统包括:更新所述言语识别系统以包括所述一个或多个子序列;以及向所述一个或多个子序列指派相应的出现概率,所述出现概率高于其它词序列的给定出现概率。5.根据权利要求1所述的方法,进一步包括:将所述言语识别系统中的给定词序列的搜索空间约束至至少所述一个或多个子序列,以供所述言语识别系统将所述给定说出话语转换成所述给定词序列。6.根据权利要求1所述的方法,进一步包括:使得所述言语识别系统在尝试将所述给定说出话语与其它词序列匹配之前,尝试将所述给定说出话语与所述一个或多个子序列中的一个子序列匹配。7.根据权利要求1所述的方法,进一步包括:基于指示所述搜索查询的所述流行度的所述信息为所述一个或多个子序列指派相应的出现概率,其中,所述相应的出现概率随时间变化。8.根据权利要求1所述的方法,进一步包括:基于指示所述搜索查询的所述流行度的所述信息向所述一个或多个子序列指派相应的出现概率;不断接收所述搜索查询的所述流行度的已更新的信息;以及基于已更新的信息来修改所述相应的出现概率。9.根据权利要求8所述的方法,其中,所述相应的出现概率基于已更新的信息而随时间推移衰减。10.根据权利要求1所述的方法,其中,所述计算装置包括所述言语识别系统。11.根据权利要求1所述的方法,其中,指示所述搜索查询的所述流行度的所述信息是基于所述搜索查询向搜索引擎的提交频率。12.根据权利要求11所述的方法,其中,确定词的所述一个或多个子序列包括:基于所述搜索查询向所述搜索引擎的所述提交频率超过阈值,来确定词的一个或多个子序列。13.一种其上存...

【专利技术属性】
技术研发人员:佩德罗·J·莫雷诺·门吉巴尔杰弗瑞·斯科特·索伦森尤金·魏因施泰因
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1