语音识别制造技术

技术编号:10851734 阅读:109 留言:0更新日期:2015-01-01 00:13
本发明专利技术提供一种语音识别电路,包括:活动检测电路,用于在输入电子信号中识别声音信号的存在;触发短语检测器,用于在任何已识别的声音信号中识别触发短语;比较电路,用于将在所述输入电子信号中的声音信号的存在被识别的次数与在所述声音信号中所述触发短语被识别的次数作比较,并且用于响应于所述比较而调整所述活动检测电路。另外,本发明专利技术还提供了相应的语音识别方法、语音识别系统、模拟-数字转换器、以及用于在语音识别系统中使用的集成电路。

【技术实现步骤摘要】
语音识别
本专利技术涉及语音识别,且具体涉及一种系统,该系统能够检测到密码短语已经被 讲出,并且也能够证实该密码短语由指定的说话人讲出,允许该系统被用作激活更高功耗 功能(诸如消费者设备中的语音识别)的免提低功耗装置,其中智能电话只是这样的消费 者设备的一个实施例。本专利技术的多个方面还涉及适合用在这样的系统或设备中的模拟-数 字转换器。
技术介绍
提供当在待机模式时能够连续监听语音命令的电路系统是已知的。这免除了对用 于将该设备从待机模式总体唤醒(例如以激活语音识别功能)的按钮或其他机械触发器 的需求。 启动免提操作的一种可能方式是使电话的用户说一个关键短语,例如电话你好 (Hello phone)。然后,该设备能够识别该关键短语已被讲出,并唤醒语音识别功能,以及 还可能唤醒该设备的其余部分。此外,该免提命令可以被编程为用户专用的,在此情况下, 只有先前注册的用户(或多个用户)能够说出该关键短语,且该设备将能够验证就是那个 特定用户在讲话(识别讲话人)且进而唤醒语音识别功能。 然而,这样的电路系统实施了相对复杂的算法且因此具有相对高的功耗,意味着 将这样的电路系统在具有有限电池容量或其他电力可用性约束的便携设备之内保持连续 激活是有点不切实际的。 为了执行对声音的数字处理,通常有必要用传声器检测声音,传声器生成模拟信 号,并且以适合这样的处理的形式进行模拟-数字转换,以生成数字信号。 为了在语音信号的数字化中为可靠的语音识别或用户识别提供足够的准确度,需 要高性能的模拟-数字转换器(ADC)。通常,这将包含嵌入在反馈回路中以将量化噪音频谱 塑形的一些单个位(single-bit)或多位(multi-bit)量化器,例如作为Δ-Σ模拟-数字 转换器。 量化器可采取多种形式,包含电压-频率转换器(或电压控制振荡器(VC0)),后 跟计数器。VC0以取决于其输入模拟电压信号的当前值的频率生成脉冲串(pulse train)。 该计数器可以计数在给定时间区间内由该电压控制振荡器生成的脉冲的数量。在每个区间 期间累积的数字计数值因此取决于生成脉冲的频率,且因此是对呈现给该量化器的模拟信 号的当前值的度量。 ADC反馈回路通常也会包括数字-模拟转换器(DAC),以从该量化器的数字输出提 供模拟反馈信号;以及模拟运放积分器,以接纳此反馈信号和输入信号。这些模拟组件必须 具有低的热噪声和足够的速度,且因此它们将会消耗相对高的功率。同样,将这样的ADC电 路系统在具有有限电池容量或其他电力可用性约束的便携设备之内保持连续激活是有点 不切实际的。
技术实现思路
根据本专利技术,提供了一种语音识别系统,包括: 一个输入,用于接收来自至少一个传声器的输入信号; 第一缓存器,用于存储所述输入信号; 降噪模块,用于接收所述输入信号并且生成一个降噪输入信号; 语音识别引擎,用于接收从所述第一缓存器输出的输入信号或接收来自所述降噪 模块的降噪输入信号;以及 选择电路,用于将从所述第一缓存器输出的输入信号或来自所述降噪模块的降噪 输入信号导引到所述语音识别引擎。 【附图说明】 为了更好地理解本专利技术,以及示出如何实施本专利技术,将以示例方式参照附图,在附 图中: 图1不出了移动电话和多种外围设备; 图2示出了图1的移动电话中的音频处理电路系统的组件; 图3示出了图2的涉及该设备的语音识别的组件的简化示意图; 图4是例示了用于使能语音识别系统的过程的总体形式的流程图; 图5a例示了在语音识别系统中的功能模块; 图5b_5e例示了图5a的系统的运行; 图6是例示了图4中示出的过程的修改形式的流程图; 图7a_7k例示了图5的系统中的信号的时间关系曲线图(time history); 图8是例示了模拟-数字转换器的示意图; 图9是例示了图5的系统的部件的示意图; 图10是在一般意义上例示了模拟-数字转换器的形式的图; 图11是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字 转换器的电路图; 图12是更详细地示出了在图11的电路中的一个组件的形式的电路图; 图13是更详细地示出了在图11的电路中的另一个组件的形式的电路图; 图14是更详细地示出了在图11的电路中的组件的一种替代形式的电路图; 图15是时间关系曲线图,例示了图11的模拟-数字转换器的运行; 图16是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字 转换器的电路图; 图17是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字 转换器的电路图; 图18是例示了与图17中示出的模拟-数字转换器相同的总体形式的模拟-数字 转换器的电路图; 图19是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字 转换器的电路图; 图20是传声器封装的示意图;以及 图21是例示了模拟-数字转换器的使用的电路图。 【具体实施方式】 图1示出了根据本专利技术的一方面的消费者设备,在此实施例中,该消费者设备是 使用语音识别能够至少部分地被控制的移动电话1的形式的通信设备,更具体地是智能电 话的形式的通信设备。在此实施例中,移动电话1具有屏幕3和键盘5,然而本专利技术当然同 样可适用于具有触摸屏和/或其他用户界面的设备,以及诸如像平板计算机的用户设备, 或具有更有限的通信能力的设备诸如(纯粹)蓝牙?使能的设备,或不具有通信能力的设 备。移动电话1还具有内置扬声器7和内置主传声器9,两者都是模拟换能器。该移动电话 1还具有多个(在此具体实施例中是4个)传声器11 (其可以是模拟或数字传声器),允许 多个声学信号被接收并且被转换成相应的电信号,例如以提供用于在噪声抵消系统中使用 的多个环境噪声电信号,或者例如提供多个信号以允许波束成形能力从而增强到语音识别 系统的信号输入。 如图1中示出的,移动电话1可具有插孔插座(未例示)或类似的连接装置(诸如 USB插座或多针脚连接器插座),允许头戴送受话器(headset)(包括一对立体声耳塞13并 且可能地还包括传声器15)通过相应的导线和插孔插头(未例示)或类似的连接装置(诸 如USB插头或多针脚连接器插头)连接到该移动电话。替代地,移动电话1可被无线连接 (例如使用蓝牙?通信协议)到无线头戴送受话器17,该无线头戴送受话器17具有耳塞19 并且可能地还具有传声器21。虽然未例示,耳塞13、19也可包括一个或多个环境噪声传声 器(其可以是模拟或数字传声器),允许接收一个或多个环境噪声信号,例如用于在噪声抵 消系统中使用。 图2示出了移动电话1中的音频处理系统的组件。与蜂窝电话网络29的通信是通 过一个基带处理器(有时称为通信处理器)31处理的。应用处理器33处理的过程包括但 不限于,其中从存储器35复制音频数据或将音频数据存储到存储器35 (存储器可以是固态 的或在磁盘上的,且存储器例如可以是内置的或是可附接的,例如或是永久地在该移动电 话之内或是在可拆卸的存储器设备上)内的过程,以及其中在电话1之内内部地生成音频 数据的其他过程。本文档来自技高网
...

【技术保护点】
语音识别电路,其特征在于,包括:活动检测电路,用于在输入电子信号中识别声音信号的存在;触发短语检测器,用于在任何已识别的声音信号中识别触发短语;比较电路,用于将在所述输入电子信号中的声音信号的存在被识别的次数与在所述声音信号中所述触发短语被识别的次数作比较,并且用于响应于所述比较而调整所述活动检测电路。

【技术特征摘要】
2013.06.26 GB 1311375.8;2013.06.26 GB 1311381.6;201. 语音识别电路,其特征在于,包括: 活动检测电路,用于在输入电子信号中识别声音信号的存在; 触发短语检测器,用于在任何已识别的声音信号中识别触发短语; 比较电路,用于将在所述输入电子信号中的声音信号的存在被识别的次数与在所述声 音信号中所述触发短语被识别的次数作比较,并且用于响应于所述比较而调整所述活动检 测电路。2. 根据权利要求1所述的语音识别电路,其中所述比较电路被配置以获得作为在所述 输入电子信号中的声音信号的存在被识别的次数的第一计数值,并且获得作为在所述声音 信号中所述触发短语被识别的次数的第二计数值,并且获得作为所述第二计数值与所述第 一计数值的比的检测比。3. 根据权利要求1或2所述的语音识别电路,其中所述活动检测电路适于当所述输入 电子信号的水平超过预定阈值水平时识别所述输入电子信号中的声音信号的存在,且其中 所述比较电路适于通过调整所述预定阈值水平来调整所述活动检测电路。4. 根据权利要求1或2所述的语音识别电路,其中所述活动检测电路适于在识别出所 述输入电子信号中的声音信号的存在之前将所述输入电子信号滤波,且其中所述比较电路 适于通过调整所述滤波来调整所述活动检测电路。5. 根据权利要求4所述的语音识别电路,其中所述比较电路适于基于所述输入电子信 号的频率分量来调整所述滤波。6. 多阶段的语音识别方法,其特征在于,包括: 第一阶段,包含,试图在输入电子信号中识别声音信号的存在;以及 第二阶段,包含,当在所述第一阶段中识别到声音信号的存在时,试图在所述声音信号 中识别触发短语; 所述方法还包括: 将在所述输入电子信号中的声音信号的存在被识别的次数与在所述声音信号中所述 触发短语被识别的次数作比较;以及 当所述比较满足一个预定判据时,调整所述第一阶段的方法。7. 根据权利要求6所述的语音识别方法,其中比较的步骤包括: 获得作为在一个时间段内在所述输入电子信号中的声音信号的存在被识别的次数的 第一计数值; 获得作为在所述时间段内在所述声音信号中所述触发短语被识别的次数的第二计数 值; 获得作为所述第二计数值与所述第一计数值的比的检测比;以及 当所述检测比低于一个预定阈值比时,调整所述第一阶段的方法。8. 根据权利要求6或7所述的方法,其中所述第一阶段的方法包括,通过确定所述输入 电子信号的水平是否超过一个预定阈值水平而在所述输入电子信号中识别声音信号的存 在,并且其中通过调整所述预定阈值水平来调整所述第一阶段的方法。9. 根据权利要求6或7所述的方法,其中所述第一阶段的方法包括在试图识别所述输 入电子信号中的声音信号的存在之前将所述输入电子信号滤波,并且其中通过调整所述滤 波来调整所述第一阶段的方法。10. 根据权利要求9所述的方法,当权利要求9从属于权利要求7时,该方法包括:当 所述检测比低于所述预定阈值比时,检查所述输入电子信号的频率分量,并且通过基于所 述输入电子信号的频率分量调整所述滤波来调整所述第一阶段的方法。11. 多阶段的语音识别电路,其特征在于,包括: 信号检测电路系统,用于在输入信号中检测声音信号的存在; 触发短语检测电路系统,用于当通过所述信号检测电路系统检测到声音信号的存在 时,在所述声音信号中检测触发短语; 该语音识别电路还包括: 第一计数器,用于计数所述信号检测电路系统在输入电子信号中检测到声音信号的存 在的次数,并且提供第一计数值; 第二计数器,用于计数所述触发短语检测电路系统在所述声音信号中检测到触发短语 的存在的次数,并且提供第二计数值; 计数电路系统,用于获得作为所述第二计数值与所述第一计数值的比的检测比,并且 用于当所述检测比低于一个预定阈值比时调整所述信号检测电路系统。12. 语音识别电路,其特征在于,包括: 第一检测电路系统,用于在输入信号中检测声音信号的存在; 第二检测电路系统,用于当通过信号检测电路系统检测到声音信号的存在时,在所述 声音信号中检测触发要素; 所述语音识别电路还包括: 计数电路系统,用于: 计数所述第一检测电路系统在输入电子信号中检测到声音信号的存在的次数,并且提 供第一计数值; 计数所述第二检测电路系统在所述声音信号中检测到触发短语的存在的次数,并且提 供第二计数值; 获得作为所述第二计数值与所述第一计数值的比的检测比;并且 用于当所述检测比低于一个预定阈值比时调整所述信号检测电路系统。13. 多阶段的语音识别电路,其特征在于,包括: 信号活动检测电路系统,用于确定在输入信号中的声音信号的存在;以及 关键词检测电路系统,用于当通过所述信号活动检测电路系统检测到声音信号的存在 时,确定在所述声音信号中的关键词的存在; 该语音识别电路还包括: 第一计数器,用于计数在输入电子信号中的声音信号的存在被识别的次数; 第二计数器,用于计数在所述声音信号中的所述关键词被识别的次数; 计数分析器,用于确定在所述第二计数器与所述第一计数器之间的检测比,并且用于 当所述检测比低于一个预定阈值比时,响应于所述检测比调整所述信号活动检测电路系统 对所述输入信号的灵敏度。14. 语音识别电路,其特征在于,包括: 输入电路系统,用于...

【专利技术属性】
技术研发人员:R·J·哈特菲尔德J·P·莱索
申请(专利权)人:沃福森微电子股份有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1