用于增强话音识别准确度的有地理标记的环境音频的系统及方法技术方案

技术编号：13306496 阅读：80 留言：0更新日期：2016-07-10 01:44

用于增强话音识别准确度的方法、系统和装置、包括在计算机存储介质上编码的计算机程序。在一个方面，一种方法包括：接收与由多个移动设备在多个地理位置记录的环境音频对应的有地理标记的音频信号；接收与由特定移动设备记录的话语对应的音频信号；确定与特定移动设备相关联的特定地理位置；使用有地理标记的音频信号的子集来针对特定地理位置生成噪声模型，其中使用已经针对特定地理位置生成的噪声模型来对与话语对应的音频信号执行噪声补偿。

全部详细技术资料下载

【技术实现步骤摘要】
本申请是2012年10月12日进入中国国家阶段的、国际申请日为2011年3月22日的、申请号为201180019038.8的专利技术专利申请(名称为“用于增强话音识别准确度的有地理标记的环境音频”)的分案申请。相关申请的交叉引用本申请要求于2010年4月14日提交的、标题为GEOTAGGEDENVIRONMENTALAUDIOFORENHANCEDSPEECHRECOGNITIONACCURACY的第12/760,147号美国申请的优先权，其公开的内容通过引用并入于此。
本说明书涉及话音识别。
技术介绍
如在本说明书中所用，“搜索查询”包括当用户请求搜索引擎执行搜索查询时用户向搜索引擎提交的一个或者多个查询检索词，其中“检索词”或者“查询检索词”包括一个或者多个完全或者部分字词、字符或者字符串。搜索查询的“结果”(或者“搜索结果”)包括统一资源定位符(URI)以及其它内容，该URI引用搜索引擎确定响应于搜索查询的资源。搜索结果可以包括其它事物、比如标题、预览图像、用户评分、地图或者方向、对应资源的描述或者已经从对应资源自动或者人工提取的或者以别的方式与对应资源关联的文字摘录。在其它方式之中，用户可以通过在键盘上键入或者在话音查询的上下文中通过向移动设备的麦克风中口述查询来录入搜索查询的查询检索词。当提交语音查询时，移动设备的麦克风除了用户的口述话语之外还可能记录环境噪声或者声

【技术保护点】
一种系统，包括：一个或者多个计算机；以及计算机可读介质，耦合到所述一个或者多个计算机，所述计算机可读介质具有存储于其上的指令，所述指令在由所述一个或者多个计算机执行时使所述一个或者多个计算机执行操作，所述操作包括：接收与由移动设备记录的话语对应的音频信号；确定与所述移动设备相关联的地理位置；标识与和所述地理位置相关联的环境音频相对应的有地理标记的音频信号的集合；基于与相应的有地理标记的音频信号相关联的元数据来加权所述有地理标记的音频信号的集合中的每个有地理标记的音频信号；以及使用所述有地理标记的音频信号的集合来对与所述话语对应的所述音频信号执行噪声补偿。

【技术特征摘要】
2010.04.14 US 12/760,1471.一种系统，包括：
一个或者多个计算机；以及
计算机可读介质，耦合到所述一个或者多个计算机，所述计算机可
读介质具有存储于其上的指令，所述指令在由所述一个或者多个计算机
执行时使所述一个或者多个计算机执行操作，所述操作包括：
接收与由移动设备记录的话语对应的音频信号；
确定与所述移动设备相关联的地理位置；
标识与和所述地理位置相关联的环境音频相对应的有地理标
记的音频信号的集合；
基于与相应的有地理标记的音频信号相关联的元数据来加权
所述有地理标记的音频信号的集合中的每个有地理标记的音频信号；以
及
使用所述有地理标记的音频信号的集合来对与所述话语对应
的所述音频信号执行噪声补偿。
2.根据权利要求1所述的系统，其中所述操作还包括接收有地理
标记的音频信号，每个有地理标记的音频信号包括所述与相应的有地理
标记的音频信号相关联的元数据。
3.根据权利要求1所述的系统，其中所述操作还包括：
接收有地理标记的音频信号；
生成用于每个有地理标记的音频信号的元数据；以及
将所述元数据与所述相应的有地理标记的音频信号相关联。
4.根据权利要求1所述的系统，其中加权每个有地理标记的音频
信号包括：基于与所述相应的有地理标记的音频信号相关联的元数据以
及与和所述话语对应的所述音频信号相关联的元数据来加权所述有地理
标记的音频信号的集合中的每个有地理标记的音频信号。
5.根据权利要求1所述的系统，其中所述元数据指示背景语音是
否存在于所述相应的有地理标记的音频信号，并且加权每个有地理标记

\t的音频信号包括：基于背景语音是否存在于所述相应的有地理标记的音
频信号来加权每个有地理标记的音频信号。
6.根据权利要求1所述的系统，其中所述元数据指示与所述相应
的有地理标记的音频信号相关联的地理位置信息的准确度，并且加权每
个有地理标记的音频信号包括：基于与所述相应的有地理标记的音频信
号相关联的地理位置信息的准确度来加权每个有地理标记的音频信号。
7.根据权利要求1所述的系统，其中所述元数据指示所述相应的
有地理标记的音频信号的长度，并且加权每个有地理标记的音频信号包
括：基于所述相应的有地理标记的音频信号的长度来加权每个有地理标
记的音频信号。
8.根据权利要求1所述的系统，其中所述元数据指示所述相应的
有地理标记的音频信号的质量，并且加权每个有地理标记的音频信号包
括：基于所述相应的有地理标记的音频信号的质量来加权每个有地理标
记的音频信号。
9.根据权利要求1所述的系统，其中所述元数据指示与所述相应
的有地理标记的音频信号相关联的地理位置，并且加权每个有地理标记
的音频信号包括：基于与所述相应的有地理标记的音频信号相关联的地
理位置接近与所述移动设备相关联的地理位置来加权每个有地理标记的
音频信号。
10.根据权利要求1所述的系统，其中所述元数据指示与所述相应
的有地理标记的音频信号相关联的地理位置，并且加权每个有地理标记
的音频信号包括：基于限定与所述相应的有地理标记的音频信号相关联
的地理位置的细节的水平来加权每个有地理标记的音频信号。
11.根据权利要求1所述的系统，其中所述元数据指示与所述相应
的有地理标记的音频信号相关联的地理位置类型，并且加权每个有地理
标记的音频信号包括：基于与所述相应的有地理标记的音频信号相关联
的地理位置类型来加权每个有地理标记的音频信号。
12.根据权利要求1所述的系统，其中所述元数据指示与所述相应
的有地理标记的音频信号相关联的移动设备的类型，并且加权每个有地

\t理标记的音频信号包括：基于与所述相应的有地理标记的音频信号相关
联的移动设备的类型来加权每个有地理标记的音频信号。
13.根据权利要求1所述的系统，其中所述元数据指示与所述相应
的有地理标记的音频信号相关联的一天中的某个时间，并且加权每个有
地理标记的音频信号包括：基于与所述相应的有地理标记的音频信号相
关联的一天中的某个时间来加权每个有地理标记的音频信号。
14.根据权利要求1所述的系统，其中所述元数据指示与所述相应
的有地理标记的音频信号相关联的一周中的某天，并且加权每个有地理
标记的音频信号包括：基于与所述相应的有地理标记的音频信号相关联
的一周中的某天来加权每个有地理标记的音频信号。
15.根据权利要求1所述的系统，其中加权每个有地理标记的音频
信号还包括：在接收与所述话语对应的所述音频信号之后，加权每个有
地理标记的音频信号。
16.根据权利要求1所述的系统，其中使用所述有地理标记的音频
信号的集合来执行噪声补偿，包括：
使用所述加权的有地理标记的音频信号的集合来生成用于所述地
理位置的噪声模型；以及
使用所生成的噪声模型对与所述话语对应的所述音频信号执行噪
声补偿。
17.根据权利要求1所述的系统，其中所述操作还包括使用所述噪
声补偿的音频信号来对所述话语执行话音识别。
18.根据权利要求1所述的系统，其中使用所述有地理标记的音频
信号的集合来执行噪声补偿，还包括：使用所述加权的有地理标记的音
频信号的集合以及使用所述音频信号的与所述话语相对应的环境音频部
分来针对与所述话语相对应的所述音频信号执行噪声补偿。
19.一种用计算机程序编码的计算机存储介质，所述程序包括指令，
所述指令在由一个或者多个计算机执行时使得所述一个或者多个计算机
执行操作，所述操作包括：
接收与由移动设备记录的话语对应的音频信号；
确定与所述移动设备相关联的地理位置；
标识与和所述地理位置相关联的环境音频相对应的有地理标记的
音频信号的集合；
基于与相应的有地理标记的音频信号相关联的元数据来加权所述
有地理标记的音频信号的集合中的每个有地理标记的音频信号；以及
使用所述有地理标记的音频信号的集合来对与所述话语对应的所
述音频信号执行噪声补偿。
20.一种计算机实现的方法，包括：
接收与由移动设备记录的话语对应的音频信号；
确定与所述移动设备相关联的地理位置；
标识与和所述地理位置相关联的环境音频相对应的有地理标记的
音频信号的集合；
基于与相应的有地理标记的音频信号相关联的元数据来加权所述
有地理标记的音频信号的集合中的每个有地理标记的音频信号；以及
使用所述有地理标记的音频信号的集合来对与所述话语对应的所
述音频信号执行噪声补偿。
21.根据权利要求20所述的计算机实现的方法，其中所述操作还
包括接收有地理标记的音频信号，每个有地理标记的音频信号包括所述
与相应的有地理标记的音频信号相关联的元数据。
22.根据权利要求20所述的计算机实现的方法，其中所述操作还
包括：接收有地理标记的音频信号；生成用于每个有地理标记的音频信
号的元数据；以及将所述元数据与所述相应的有地理标记的音频信号相
关联。
23.根据权利要求20所述的计算机实现的方法，其中所述元数据
指示背景语音是否存在于所述相应的有地理标记的音频信号，并且加权
每个有地理标记的音频信号包括：基于背景语音是否存在于所述相应的
有地理标记的音频信号来加权每个有地理标记的音频信号。
24.根据权利要求20所述的计算机实现的方法，其中所述元数据

\t指示与所述相应的有地理标记的音频信号相关联的地理位置信息的准确
度，并且加权每个有地理标记的音频信号包括：基于与所述相应的有地
理标记的音频信号相关联的地理位置信息的准确度来加权每个有地理标
记的音频信号。
25.根据权利要求20所述的...

【专利技术属性】
技术研发人员：T·克里斯特詹森，M·I·洛伊德，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人