语音识别制造技术

技术编号:21955288 阅读:33 留言:0更新日期:2019-08-24 19:07
本发明专利技术提供一种语音识别电路,包括:活动检测电路,用于在输入电子信号中识别声音信号的存在;触发短语检测器,用于在任何已识别的声音信号中识别触发短语;比较电路,用于将在所述输入电子信号中的声音信号的存在被识别的次数与在所述声音信号中所述触发短语被识别的次数作比较,并且用于响应于所述比较而调整所述活动检测电路。另外,本发明专利技术还提供了相应的语音识别方法、语音识别系统、模拟‑数字转换器、以及用于在语音识别系统中使用的集成电路。

speech recognition

【技术实现步骤摘要】
语音识别本申请是申请日为2014年6月26日、申请号为201410294260.4、名称为“语音识别”的专利技术专利申请的分案申请。
本专利技术涉及语音识别,且具体涉及一种系统,该系统能够检测到密码短语已经被讲出,并且也能够证实该密码短语由指定的说话人讲出,允许该系统被用作激活更高功耗功能(诸如消费者设备中的语音识别)的免提低功耗装置,其中智能电话只是这样的消费者设备的一个实施例。本专利技术的多个方面还涉及适合用在这样的系统或设备中的模拟-数字转换器。
技术介绍
提供当在待机模式时能够连续监听语音命令的电路系统是已知的。这免除了对用于将该设备从待机模式总体“唤醒”(例如以激活语音识别功能)的按钮或其他机械触发器的需求。启动免提操作的一种可能方式是使电话的用户说一个关键短语,例如“电话你好(Hellophone)”。然后,该设备能够识别该关键短语已被讲出,并唤醒语音识别功能,以及还可能唤醒该设备的其余部分。此外,该免提命令可以被编程为用户专用的,在此情况下,只有先前注册的用户(或多个用户)能够说出该关键短语,且该设备将能够验证就是那个特定用户在讲话(识别讲话人)且进而唤醒语音识别功能。然而,这样的电路系统实施了相对复杂的算法且因此具有相对高的功耗,意味着将这样的电路系统在具有有限电池容量或其他电力可用性约束的便携设备之内保持连续激活是有点不切实际的。为了执行对声音的数字处理,通常有必要用传声器检测声音,传声器生成模拟信号,并且以适合这样的处理的形式进行模拟-数字转换,以生成数字信号。为了在语音信号的数字化中为可靠的语音识别或用户识别提供足够的准确度,需要高性能的模拟-数字转换器(ADC)。通常,这将包含嵌入在反馈回路中以将量化噪音频谱塑形的一些单个位(single-bit)或多位(multi-bit)量化器,例如作为Δ-Σ模拟-数字转换器。量化器可采取多种形式,包含电压-频率转换器(或电压控制振荡器(VCO)),后跟计数器。VCO以取决于其输入模拟电压信号的当前值的频率生成脉冲串(pulsetrain)。该计数器可以计数在给定时间区间内由该电压控制振荡器生成的脉冲的数量。在每个区间期间累积的数字计数值因此取决于生成脉冲的频率,且因此是对呈现给该量化器的模拟信号的当前值的度量。ADC反馈回路通常也会包括数字-模拟转换器(DAC),以从该量化器的数字输出提供模拟反馈信号;以及模拟运放积分器,以接纳此反馈信号和输入信号。这些模拟组件必须具有低的热噪声和足够的速度,且因此它们将会消耗相对高的功率。同样,将这样的ADC电路系统在具有有限电池容量或其他电力可用性约束的便携设备之内保持连续激活是有点不切实际的。
技术实现思路
根据本专利技术,提供了一种语音识别系统,包括:一个输入,用于接收来自至少一个传声器的输入信号;第一缓存器,用于存储所述输入信号;降噪模块,用于接收所述输入信号并且生成一个降噪输入信号;语音识别引擎,用于接收从所述第一缓存器输出的输入信号或接收来自所述降噪模块的降噪输入信号;以及选择电路,用于将从所述第一缓存器输出的输入信号或来自所述降噪模块的降噪输入信号导引到所述语音识别引擎。附图说明为了更好地理解本专利技术,以及示出如何实施本专利技术,将以示例方式参照附图,在附图中:图1示出了移动电话和多种外围设备;图2示出了图1的移动电话中的音频处理电路系统的组件;图3示出了图2的涉及该设备的语音识别的组件的简化示意图;图4是例示了用于使能语音识别系统的过程的总体形式的流程图;图5a例示了在语音识别系统中的功能模块;图5b-5e例示了图5a的系统的运行;在图5c中,处理延迟,最小缓存时间;在图5d中,最小缓存时间;在图5e中,最大缓存时间;图6是例示了图4中示出的过程的修改形式的流程图;图7a-7k例示了图5的系统中的信号的时间关系曲线图(timehistory);图7a为模拟环境噪声&语音;图7b为数字环境噪声&语音,为(112)&缓存器(110)输入;图7c为(112)输出;图7d为来自缓存器(110)的输出以及(118)输入;图7e为(118)输出;图7f为经由路径选择的来自缓存器(110)的输出;图7g为来自缓存器(144)的输出,为(122)输入;图7h为来自(122)的输出,为SRE(132)输入;图7i为降噪(134)输入;图7j为降噪内部结果;图7k为降噪经缓存的内部结果;图8是例示了模拟-数字转换器的示意图;图9是例示了图5的系统的部件的示意图;图10是在一般意义上例示了模拟-数字转换器的形式的图;图11是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图12是更详细地示出了在图11的电路中的一个组件的形式的电路图;图13是更详细地示出了在图11的电路中的另一个组件的形式的电路图;图14是更详细地示出了在图11的电路中的组件的一种替代形式的电路图;图15是时间关系曲线图,例示了图11的模拟-数字转换器的运行;图16是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图17是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图18是例示了与图17中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图19是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图20是传声器封装的示意图;以及图21是例示了模拟-数字转换器的使用的电路图。具体实施方式图1示出了根据本专利技术的一方面的消费者设备,在此实施例中,该消费者设备是使用语音识别能够至少部分地被控制的移动电话1的形式的通信设备,更具体地是智能电话的形式的通信设备。在此实施例中,移动电话1具有屏幕3和键盘5,然而本专利技术当然同样可适用于具有触摸屏和/或其他用户界面的设备,以及诸如像平板计算机的用户设备,或具有更有限的通信能力的设备诸如(纯粹)蓝牙TM使能的设备,或不具有通信能力的设备。移动电话1还具有内置扬声器7和内置主传声器9,两者都是模拟换能器。该移动电话1还具有多个(在此具体实施例中是4个)传声器11(其可以是模拟或数字传声器),允许多个声学信号被接收并且被转换成相应的电信号,例如以提供用于在噪声抵消系统中使用的多个环境噪声电信号,或者例如提供多个信号以允许波束成形能力从而增强到语音识别系统的信号输入。如图1中示出的,移动电话1可具有插孔插座(未例示)或类似的连接装置(诸如USB插座或多针脚连接器插座),允许头戴送受话器(headset)(包括一对立体声耳塞13并且可能地还包括传声器15)通过相应的导线和插孔插头(未例示)或类似的连接装置(诸如USB插头或多针脚连接器插头)连接到该移动电话。替代地,移动电话1可被无线连接(例如使用蓝牙TM通信协议)到无线头戴送受话器17,该无线头戴送受话器17具有耳塞19并且可能地还具有传声器21。虽然未例示,耳塞13、19也可包括一个或多个环境噪声传声器(其可以是模拟或数字传声器),允许接收一个或多个环境噪声信号,例如用于在噪声抵消系统中使用。图2示出了移动电话1中的音频处理系统的组件。与蜂窝电话网络29的通信是通过一个基带处理器(有时称为通信处理器)31处理的。应用本文档来自技高网
...

【技术保护点】
1.模拟‑数字转换器,包括:输入,用于接收模拟输入信号;电压控制振荡器,用于接收所述模拟‑数字转换器的第一低功率运行模式下的所述模拟输入信号;计数器,被连接以接收所述电压控制振荡器的输出并且生成输出数字信号;输出,用于提供所述输出数字信号;以及控制器,用于将所述模拟‑数字转换器在第一低功率模式和第二高精度模式之间切换。

【技术特征摘要】
2013.06.26 GB 1311381.6;2013.06.26 GB 1311375.8;201.模拟-数字转换器,包括:输入,用于接收模拟输入信号;电压控制振荡器,用于接收所述模拟-数字转换器的第一低功率运行模式下的所述模拟输入信号;计数器,被连接以接收所述电压控制振荡器的输出并且生成输出数字信号;输出,用于提供所述输出数字信号;以及控制器,用于将所述模拟-数字转换器在第一低功率模式和第二高精度模式之间切换。2.根据权利要求1所述的模拟-数字转换器,还包括:数字-模拟转换器,被连接至所述输出,用于将所述输出数字信号转换成反馈模拟信号;减法器,被连接以接收输入信号和所述反馈模拟信号且以形成所述输入信号和所述反馈模拟信号的差;积分器,用于接收所述输入信号和所述反馈模拟信号的差,且用于形成积分误差信号;且可控开关,用于将所述输入信号或者所述积分误差信号提供至所述电压控制振荡器。3.根据权利要求2所述的模拟-数字转换器,其中当所述可控开关被控制以将所述输入信号提供至所述电压控制振荡器时,所述数字-模拟转换器和所述积分器被禁用。4.根据权利要求2或3所述的模拟-数字转换器,其中所述积分器包括运算放大器。5.根据权利要求2-4中的一项所述的模拟-数字转换器,还包括连接至所述输出的滤波器,用于将滤波信号作为输入提供至所述数字-模拟转换器。6.传声器封装,包括:传声器;根据权利要求1-5中的任一项所述的模拟-数字转换器;以及检测电路,用于响应于由所述传声器生成的信号的性质来控制所述模拟-数字转换器的模式。7.活动检测器,包括:多个传声器;根据权利要求1-5中的任一项所述的模拟-数字转换器,所述模拟-数字转换器适于接收来自所述多个传声器中的每个传声器的信号;以及控制电路,用于配置所述模拟-数字转换器以依次接收来自所述多个传声器中的每个传声器的信号,并且用于响应于来自所述多个传声器中的每个传声器的信号所生成的输出信号来选择所述传声器中的一个传声器。8.根据权利要求7所述的活动检测器,其中所述模拟-数字转换器包括多个并行路径,用于接收来自所述多个传声器中的每个传声器的信号。9.活动检测器,包括:传声器;根据权利要求1-5中的任一项所述的模拟-数字转换器,用于接收来自所述传声器的信号;以及检测器电路,用于响应于所述模拟-数字转换器的输出数字信号的性质来控制模拟-数字转换器的运行模式。10.根据权利要求9所述的活动检测器,其中所述检测器电路适于响应于所述模拟-数字转换器的输出数字信号的幅度来控制所述模拟-数字转换器的运行模式。11.根据权利要求10所述的活动检测器,其中所述检测器电路适于响应于所述模拟-数字转换器在至少一个指定频带中的输出数字信号的幅度来控制所述模拟-数字转换器的运行模式。12.一种模拟-数字转换器,用于转换在输入处所接收的模拟信号,包括:量化器,具有量化器输入和量化器输出;以及反馈路径,在所述量化器附近,其中所述模拟-数字转换器能够运行在第一模式,在该第一模式中,所述反馈路径被使能以使得在将输入信号施加到所述量化器输入之前,将输入信号和反馈信号作比较;以及其中所述模拟-数字转换器能够运行在第二模式,在该第二模式中,所述反馈路径被禁用,以使得所述输入信号不经与反馈信号作比较就被施加到所述量化器输入;以及其中所述量化器包括:控制振荡器,该控制振荡器的输出频率依赖于该控制振荡器的输入信号;以及计数器,用于计数所述控制振荡器的输出脉冲。13.根据权利要求12所述的模拟-数字转换器,其中所述量化器在第二模式中以低频率运行。14.根据权利要求12或13所述的模拟-数字转换器,还包括多路复用器,用于响应于输入模式控制信号来将输入或者反馈路径选择性地联接至所述量化器。15.传声器封装,包括:传声器;根据权利要求12-14中的任一项所述的模拟-数字转换器;以及检测电路,用于响应于由所述传声器生成的信号的性质以及所述模拟-数字转换器的输入来控制模拟-数字转换器的模式。16.根据权利要求15所述的传声器封装,还包括格式化器,用于生成包括...

【专利技术属性】
技术研发人员:R·J·哈特菲尔德J·P·莱索
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:英国,GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1