用于适配语音识别声学模型的方法和系统技术方案

技术编号：10539719 阅读：124 留言：0更新日期：2014-10-15 15:55

本发明专利技术涉及用于适配语音识别声学模型的方法和系统。具体地，一种声学模型适配系统包括存储器设备和被耦合到存储器设备的模型选择器引擎。模型选择器引擎被配置成编译环境条件的信息以针对到设备上的语音识别器中的音频输入而标识当前语音环境。模型选择器引擎还被配置成将环境条件的信息与声学模型的简档相比较。每个简档与声学模型相关联。每个声学模型补偿音频输入的背景噪声或声学失真。模型选择器引擎还被配置成在不包括来自用户的音频输入的情况下，基于环境条件的信息来选择用于语音识别器的第一声学模型。

全部详细技术资料下载

【技术实现步骤摘要】
用于适配语音识别声学模型的方法和系统
本专利技术涉及语音识别，更具体地，涉及用于适配语音识别声学模型的方法和系统。
技术介绍
语音识别系统将说话者的话语转换成数字内容或命令。语音识别系统对其音频输入敏感。背景噪声和声学失真影响语音识别系统的性能。为了克服背景噪声和声学失真而采用多个技术。许多大型词汇语音识别器要求其中用户听写一定数目的预定义句子的训练过程。此训练过程构建声学模型，来帮助系统不仅理解用户如何说话，而且理解背景噪声和声学失真。
技术实现思路
描述了系统的实施方式。在一个实施方式中，声学模型适配系统包括存储器设备和被耦合到存储设备的模型选择器引擎。模型选择器引擎被配置成编译环境条件的信息，以针对到设备上的语音识别器中的音频输入而标识当前语音环境。模型选择器引擎还被配置成将环境条件的信息与声学模型的简档（profile）相比较。每个简档与声学模型相关联。每个声学模型补偿音频输入的背景噪声或声学失真。模型选择器引擎还被配置成在不包括来自用户的音频输入的情况下基于环境条件的信息来选择用于语音识别器的第一声学模型。还描述了系统的其他实施方式以及计算机程序产品和方法的实施方式。根据结合以本原理的示例的方式举例说明的附图进行的以下详细描述，本专利技术的实施方式的其他方面和优点将变得显而易见。附图说明图1描述了用于选择用于语音识别器的声学模型的系统的一个实施方式的示意图。图2描述了图1的声学模型适配系统的一个实施方式的示意图。图3描述了图2的模型选择器引擎的一个实施方式。图4描述了用于在没有音频输入的帮助的情况下选择语音识别声学模型的方法的一个实施方式的流程图。图...
用于适配语音识别声学模型的方法和系统

【技术保护点】
一种用于适配语音识别声学模型的方法，所述方法包括：在不包括来自用户的音频输入的情况下，编译环境条件的信息，以针对到设备上的语音识别器中的音频输入标识当前语音环境；将所述环境条件的所述信息与声学模型的简档相比较，其中每个简档与声学模型相关联，并且其中每个声学模型补偿所述音频输入的背景噪声或声学失真；以及在不包括来自所述用户的音频输入的情况下，基于所述环境条件的所述信息来选择用于所述语音识别器的第一声学模型。

【技术特征摘要】
2013.04.05 US 13/857,5711.一种用于适配语音识别声学模型的方法，所述方法包括：在不包括来自用户的音频输入的情况下，编译环境条件的信息，以针对到设备上的语音识别器中的音频输入标识当前语音环境,其中编译所述环境条件的所述信息包括：确定所述设备的特定距离内的人数的估计，其中确定所述估计包括编译所述设备的所述距离内的本地无线设备的数目的信息；将所述环境条件的所述信息与声学模型的简档相比较，其中每个简档与声学模型相关联，并且其中每个声学模型补偿所述音频输入的背景噪声或声学失真；以及在不包括来自所述用户的音频输入的情况下，基于所述环境条件的所述信息来选择用于所述语音识别器的第一声学模型。2.根据权利要求1所述的方法，其中所述方法还包括：响应于检测到所述音频输入的声学特性与选择的第一简档相差预定阈值，创建新声学模型和新简档。3.根据权利要求2所述的方法，其中所述方法还包括：调整所述新声学模型以匹配所述音频输入的所述声学特性。4.根据权利要求1所述的方法，其中编译所述环境条件的所述信息包括：确定所述设备的特定距离内的人数的估计，其中确定所述估计包括编译社交网络统计的信息。5.根据权利要求1所述的方法，其中编译所述环境条件的所述信息包括：标识所述设备的位置并将所述设备的所述位置与位置数据库相比较。6.根据权利要求1所述的方法，其中编译所述环境条件的所述信息包括：检测被连接到所述设备的麦克风以确定所述设备的位置。7.一种声学模型适配系统，所述系统包括：存储器设备，以及模型选择器引擎，被耦合到存储器设备，所述模型选择器引擎被配置成：在不包括来自用户的音频输入的情况下，编译环境条件的信息，以针对到设备上的语音识别器中的音频输入标识当前语音环境,其中编译所述环境条件的所述信息包括：确定所述设备的特定距离内的人数的估计，其中确定所述估计包括编译所述设备的所述距离内的本地无线设备的数目的信息；将所述环境条件的所述信息与声学模型的简档相比较，其中每个简档与声学模型相关联，并且其中每个声学模型补偿所述音频输入的背景噪声或声学失真；以及在不包括来自所述用户的音频输入的情况下，基于所述环境条件的所述信息来选择用于所述语音识别器的第一声学模型。8.根据权利要求7所述的系统，...

【专利技术属性】
技术研发人员：D·A·贝尔，L·S·德卢卡，J·H·詹金斯，J·A·库斯尼茨，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人