用于使用搜索查询信息的言语识别处理的方法和系统技术方案

技术编号：15642588 阅读：135 留言：0更新日期：2017-06-16 16:05

本申请涉及用于使用搜索查询信息的言语识别处理的方法和系统。描述了用于言语识别处理的方法和系统。在示例中，计算装置可被配置为接收指示搜索查询向用于所述搜索查询的搜索引擎的提交频率的信息，所述搜索查询由词序列组成。基于搜索查询的提交频率超过阈值，计算装置可被配置为基于该搜索查询的一个或多个词出现于该搜索查询的词序列中的顺序来确定所述一个或多个词的分组。另外，计算装置可被配置为将指示所述分组的信息提供给言语识别系统。

全部详细技术资料下载

【技术实现步骤摘要】
用于使用搜索查询信息的言语识别处理的方法和系统分案说明本申请属于申请日为2013年10月14日的中国专利技术专利申请201380064902.5的分案申请。相关申请的交叉引用本申请要求2013年3月15日提交的并且题为“MethodsAndSystemsForSpeechRecognitionProcessingUsingSearchQueryInformation”的美国专利申请序列号13/832,136的优先权，它是2012年10月18日提交的并且题为“MethodsandSystemsforSpeechRecognitionProcessingUsingSearchQueryInformation”的美国专利申请序列号61/715,365的非临时申请，所有这些专利申请在此通过引用并入本文，如同在本说明书中充分阐述一样。
技术介绍
自动言语识别(ASR)技术可用于将音频话语映射至那些话语的文本表示。一些ASR系统使用“训练”，其中个体说话人将文本段读入到言语识别系统中。这些系统分析人的特定语音并且使用该语音来精细调节对该人的言语的识别，从而得到更准确的转录。不使用训练的系统可被称作“说话人无关”的系统。使用训练的系统可被称作“说话人有关”的系统。
技术实现思路
本申请公开了用于言语识别处理的系统和方法。在一个方面，描述了一种方法。该方法可包括在计算装置处接收指示搜索查询向搜索引擎的提交频率的信息。所述搜索查询可包括词序列。所述方法还可包括基于所述搜索查询的提交频率超过阈值，针对所述搜索查询的所述词序列基于所述搜索查询的一个或多个词出现于所述搜索查询的所述词序列中...
用于使用搜索查询信息的言语识别处理的方法和系统

【技术保护点】
一种用于言语识别处理的方法，包括：在计算装置处接收指示包括词序列的搜索查询的流行度的信息；基于所述信息确定词的一个或多个子序列，每个子序列包括基于顺序的所述搜索查询的一个或多个词，所述一个或多个词以所述顺序出现于所述搜索查询的所述词序列中；以及提供指示词的所述一个或多个子序列的信息以更新言语识别系统，所述言语识别系统被配置为将给定说出话语转换为给定词序列。

【技术特征摘要】
2012.10.18 US 61/715,365;2013.03.15 US 13/832,1361.一种用于言语识别处理的方法，包括：在计算装置处接收指示包括词序列的搜索查询的流行度的信息；基于所述信息确定词的一个或多个子序列，每个子序列包括基于顺序的所述搜索查询的一个或多个词，所述一个或多个词以所述顺序出现于所述搜索查询的所述词序列中；以及提供指示词的所述一个或多个子序列的信息以更新言语识别系统，所述言语识别系统被配置为将给定说出话语转换为给定词序列。2.根据权利要求1所述的方法，其中，所述搜索查询包括以下中的一个或多个：文本串和语音搜索查询。3.根据权利要求1所述的方法，其中，所述言语识别系统被配置为包括给定词序列的出现概率，并且其中，提供指示词的所述一个或多个子序列的所述信息以更新所述言语识别系统包括：基于所述一个或多个子序列和指示所述搜索查询的所述流行度的所述信息来更新所述出现概率。4.根据权利要求3所述的方法，其中，提供指示词的所述一个或多个子序列的所述信息来更新所述言语识别系统包括：更新所述言语识别系统以包括所述一个或多个子序列；以及向所述一个或多个子序列指派相应的出现概率，所述出现概率高于其它词序列的给定出现概率。5.根据权利要求1所述的方法，进一步包括：将所述言语识别系统中的给定词序列的搜索空间约束至至少所述一个或多个子序列，以供所述言语识别系统将所述给定说出话语转换成所述给定词序列。6.根据权利要求1所述的方法，进一步包括：使得所述言语识别系统在尝试将所述给定说出话语与其它词序列匹配之前，尝试将所述给定说出话语与所述一个或多个子序列中的一个子序列匹配。7.根据权利要求1所述的方法，进一步包括：基于指示所述搜索查询的所述流行度的所述信息为所述一个或多个子序列指派相应的出现概率，其中，所述相应的出现概率随时间变化。8.根据权利要求1所述的方法，进一步包括：基于指示所述搜索查询的所述流行度的所述信息向所述一个或多个子序列指派相应的出现概率；不断接收所述搜索查询的所述流行度的已更新的信息；以及基于已更新的信息来修改所述相应的出现概率。9.根据权利要求8所述的方法，其中，所述相应的出现概率基于已更新的信息而随时间推移衰减。10.根据权利要求1所述的方法，其中，所述计算装置包括所述言语识别系统。11.根据权利要求1所述的方法，其中，指示所述搜索查询的所述流行度的所述信息是基于所述搜索查询向搜索引擎的提交频率。12.根据权利要求11所述的方法，其中，确定词的所述一个或多个子序列包括：基于所述搜索查询向所述搜索引擎的所述提交频率超过阈值，来确定词的一个或多个子序列。13.一种其上存...

【专利技术属性】
技术研发人员：佩德罗·J·莫雷诺·门吉巴尔，杰弗瑞·斯科特·索伦森，尤金·魏因施泰因，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人