语音识别制造技术

技术编号:22103371 阅读:25 留言:0更新日期:2019-09-14 03:49
本发明专利技术提供一种语音识别电路,包括:活动检测电路,用于在输入电子信号中识别声音信号的存在;触发短语检测器,用于在任何已识别的声音信号中识别触发短语;比较电路,用于将在所述输入电子信号中的声音信号的存在被识别的次数与在所述声音信号中所述触发短语被识别的次数作比较,并且用于响应于所述比较而调整所述活动检测电路。另外,本发明专利技术还提供了相应的语音识别方法、语音识别系统、模拟‑数字转换器、以及用于在语音识别系统中使用的集成电路。

speech recognition

【技术实现步骤摘要】
语音识别本申请是申请日为2014年6月26日、申请号为201410294260.4、名称为“语音识别”的专利技术专利申请的分案申请。
本专利技术涉及语音识别,且具体涉及一种系统,该系统能够检测到密码短语已经被讲出,并且也能够证实该密码短语由指定的说话人讲出,允许该系统被用作激活更高功耗功能(诸如消费者设备中的语音识别)的免提低功耗装置,其中智能电话只是这样的消费者设备的一个实施例。本专利技术的多个方面还涉及适合用在这样的系统或设备中的模拟-数字转换器。
技术介绍
提供当在待机模式时能够连续监听语音命令的电路系统是已知的。这免除了对用于将该设备从待机模式总体“唤醒”(例如以激活语音识别功能)的按钮或其他机械触发器的需求。启动免提操作的一种可能方式是使电话的用户说一个关键短语,例如“电话你好(Hellophone)”。然后,该设备能够识别该关键短语已被讲出,并唤醒语音识别功能,以及还可能唤醒该设备的其余部分。此外,该免提命令可以被编程为用户专用的,在此情况下,只有先前注册的用户(或多个用户)能够说出该关键短语,且该设备将能够验证就是那个特定用户在讲话(识别讲话人)且进而唤醒语音识别功能。然而,这样的电路系统实施了相对复杂的算法且因此具有相对高的功耗,意味着将这样的电路系统在具有有限电池容量或其他电力可用性约束的便携设备之内保持连续激活是有点不切实际的。为了执行对声音的数字处理,通常有必要用传声器检测声音,传声器生成模拟信号,并且以适合这样的处理的形式进行模拟-数字转换,以生成数字信号。为了在语音信号的数字化中为可靠的语音识别或用户识别提供足够的准确度,需要高性能的模拟-数字转换器(ADC)。通常,这将包含嵌入在反馈回路中以将量化噪音频谱塑形的一些单个位(single-bit)或多位(multi-bit)量化器,例如作为Δ-Σ模拟-数字转换器。量化器可采取多种形式,包含电压-频率转换器(或电压控制振荡器(VCO)),后跟计数器。VCO以取决于其输入模拟电压信号的当前值的频率生成脉冲串(pulsetrain)。该计数器可以计数在给定时间区间内由该电压控制振荡器生成的脉冲的数量。在每个区间期间累积的数字计数值因此取决于生成脉冲的频率,且因此是对呈现给该量化器的模拟信号的当前值的度量。ADC反馈回路通常也会包括数字-模拟转换器(DAC),以从该量化器的数字输出提供模拟反馈信号;以及模拟运放积分器,以接纳此反馈信号和输入信号。这些模拟组件必须具有低的热噪声和足够的速度,且因此它们将会消耗相对高的功率。同样,将这样的ADC电路系统在具有有限电池容量或其他电力可用性约束的便携设备之内保持连续激活是有点不切实际的。
技术实现思路
根据本专利技术,提供了一种语音识别系统,包括:一个输入,用于接收来自至少一个传声器的输入信号;第一缓存器,用于存储所述输入信号;降噪模块,用于接收所述输入信号并且生成一个降噪输入信号;语音识别引擎,用于接收从所述第一缓存器输出的输入信号或接收来自所述降噪模块的降噪输入信号;以及选择电路,用于将从所述第一缓存器输出的输入信号或来自所述降噪模块的降噪输入信号导引到所述语音识别引擎。附图说明为了更好地理解本专利技术,以及示出如何实施本专利技术,将以示例方式参照附图,在附图中:图1示出了移动电话和多种外围设备;图2示出了图1的移动电话中的音频处理电路系统的组件;图3示出了图2的涉及该设备的语音识别的组件的简化示意图;图4是例示了用于使能语音识别系统的过程的总体形式的流程图;图5a例示了在语音识别系统中的功能模块;图5b-5e例示了图5a的系统的运行;在图5c中,处理延迟最小缓存时间;在图5d中,最小缓存时间;在图5e中,最大缓存时间,图6是例示了图4中示出的过程的修改形式的流程图;图7a-7k例示了图5的系统中的信号的时间关系曲线图(timehistory);图7a为模拟环境噪声&语音;图7b为数字环境噪声&语音,为(112)&缓存器(110)输入;图7c为(112)输出;图7d为来自缓存器(110)的输出以及(118)输入;图7e为(118)输出;图7f为经由路径选择的来自缓存器(110)的输出;图7g为来自缓存器(144)的输出,为(122)输入;图7h为来自(122)的输出,为SRE(132)输入;图7i为降噪(134)输入;图7j为降噪内部结果;图7k为降噪经缓存的内部结果;图8是例示了模拟-数字转换器的示意图;图9是例示了图5的系统的部件的示意图;图10是在一般意义上例示了模拟-数字转换器的形式的图;图11是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图12是更详细地示出了在图11的电路中的一个组件的形式的电路图;图13是更详细地示出了在图11的电路中的另一个组件的形式的电路图;图14是更详细地示出了在图11的电路中的组件的一种替代形式的电路图;图15是时间关系曲线图,例示了图11的模拟-数字转换器的运行;图16是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图17是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图18是例示了与图17中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图19是例示了与图10中示出的模拟-数字转换器相同的总体形式的模拟-数字转换器的电路图;图20是传声器封装的示意图;以及图21是例示了模拟-数字转换器的使用的电路图。具体实施方式图1示出了根据本专利技术的一方面的消费者设备,在此实施例中,该消费者设备是使用语音识别能够至少部分地被控制的移动电话1的形式的通信设备,更具体地是智能电话的形式的通信设备。在此实施例中,移动电话1具有屏幕3和键盘5,然而本专利技术当然同样可适用于具有触摸屏和/或其他用户界面的设备,以及诸如像平板计算机的用户设备,或具有更有限的通信能力的设备诸如(纯粹)蓝牙TM使能的设备,或不具有通信能力的设备。移动电话1还具有内置扬声器7和内置主传声器9,两者都是模拟换能器。该移动电话1还具有多个(在此具体实施例中是4个)传声器11(其可以是模拟或数字传声器),允许多个声学信号被接收并且被转换成相应的电信号,例如以提供用于在噪声抵消系统中使用的多个环境噪声电信号,或者例如提供多个信号以允许波束成形能力从而增强到语音识别系统的信号输入。如图1中示出的,移动电话1可具有插孔插座(未例示)或类似的连接装置(诸如USB插座或多针脚连接器插座),允许头戴送受话器(headset)(包括一对立体声耳塞13并且可能地还包括传声器15)通过相应的导线和插孔插头(未例示)或类似的连接装置(诸如USB插头或多针脚连接器插头)连接到该移动电话。替代地,移动电话1可被无线连接(例如使用蓝牙TM通信协议)到无线头戴送受话器17,该无线头戴送受话器17具有耳塞19并且可能地还具有传声器21。虽然未例示,耳塞13、19也可包括一个或多个环境噪声传声器(其可以是模拟或数字传声器),允许接收一个或多个环境噪声信号,例如用于在噪声抵消系统中使用。图2示出了移动电话1中的音频处理系统的组件。与蜂窝电话网络29的通信是通过一个基带处理器(有时称为通信处理器)31处理的。应用处本文档来自技高网
...

【技术保护点】
1.语音处理系统,包括:输入,用于接收来自至少一个传声器的输入信号;第一信号路径,用于将所述输入连接到一个输出;第二信号路径,用于将所述输入连接到所述输出;选择电路系统,用于选择所述第一信号路径或所述第二信号路径,以将所述输入信号从所述输入运送到所述输出;其中所述第一信号路径含有第一缓存器用于存储所述输入信号;且所述第二信号路径含有降噪模块用于接收所述输入信号并且向所述输出供应一个降噪信号,且还含有第二缓存器;其中所述第二缓存器在所述第二信号路径中施加一个延迟,以使得所述降噪信号与所述第一缓存器的输出是基本时间对准的;以及信号活动检测模块,用于检测所述输入信号是否含有语音,其中所述第一缓存器包括:第一部分,该第一部分连续地缓存;以及第二部分,该第二部分仅在所述信号活动检测模块检测到该输入信号中含有语音时,才开始缓存。

【技术特征摘要】
2013.06.26 GB 1311381.6;2013.06.26 GB 1311375.8;201.语音处理系统,包括:输入,用于接收来自至少一个传声器的输入信号;第一信号路径,用于将所述输入连接到一个输出;第二信号路径,用于将所述输入连接到所述输出;选择电路系统,用于选择所述第一信号路径或所述第二信号路径,以将所述输入信号从所述输入运送到所述输出;其中所述第一信号路径含有第一缓存器用于存储所述输入信号;且所述第二信号路径含有降噪模块用于接收所述输入信号并且向所述输出供应一个降噪信号,且还含有第二缓存器;其中所述第二缓存器在所述第二信号路径中施加一个延迟,以使得所述降噪信号与所述第一缓存器的输出是基本时间对准的;以及信号活动检测模块,用于检测所述输入信号是否含有语音,其中所述第一缓存器包括:第一部分,该第一部分连续地缓存;以及第二部分,该第二部分仅在所述信号活动检测模块检测到该输入信号中含有语音时,才开始缓存。2.集成电路,包括根据权利要求1所述的语音识别系统。3.通信设备,包括根据权利要求2所述的集成电路。4.用于语音识别的方法,包括:接收来自至少一个传声器的输入信号;选择第一信号路径或第二信号路径用于将所述输入信号运送到所述输出;其中:所述第一信号路径含有第一缓存器用于存储所述输入信号;且所述第二信号路径含有降噪模块用于接收所述输入信号并且向所述输出供应一个降噪信号,且还含有第二缓存器;其中所述第二缓存器在所述第二信号路径中施加一个延迟,以使得所述降噪信号与所述第一缓存器的输出是基本时间对准的;且检测所述输入信号是否含有语音,其中所述第一缓存器包括:第一部分,该第一部分连续地缓存;以及第二部分,该第二部分仅在所述信号活动检测模块检测到该输入信号中含有语音时,才开始缓存。5.语音识别系统,包括:输入,用于接收来自至少一个传声器的输入信号;第一缓存器,用于存储所述输入信号;降噪模块,用于接收所述输入信号并且生成降噪输入信号;语音识别引擎,用于接收从所述第一缓存器输出的输入信号或接收来自所述降噪模块的降噪输入信号;以及选择电路,用于将从所述第一缓存器输出的输入信号或来自所述降噪模块的降噪输入信号导引到所述语音识别引擎。6.根据权利要求5所述的语音识别系统,所述语音识别系统具有密码短语证实功能,用于从所述输入信号确定触发短语是否由系统的授权用户讲出,其中所述选择电路被控制以仅在所述密码短语证实功能已经确定所述触发短语已经由系统的授权用户讲出之后,将来自所述降噪模块的降噪输入信号导引到所述语音识别引擎。7.根据权利要求6所述的语音识别系统,其中:所述选择电路被控制,以当所述密码短语证实功能首先确定触发短语已经由系统的授权用户讲出时,将从所述第一缓存器输出的输入信号导引到所述语音识别引擎;且其中所述选择电路被控制,以当所述语音识别引擎确定所述信号表示语音中的间隙时,将来自所述降噪模块的降噪输入信号导引到所述语音识别引擎。8.根据权利要求7所述的语音识别系统,包括第二缓存器,所述第二缓存器用于将一个时间延迟施加至所述降噪输入信号,以使得所述降噪输入信号与从所述第一缓存器输出的所述输入信号是基本时间对准的。9.集成电路,用于在语音识别系统中使用,该集成电路包括:输入,用于接收来自至少一个传声器的输入信号;第一缓存器,用于存储所述输入信号;以及降噪模块,包括第二缓存器,用于接收所述输入信号并且生成缓存的降噪输入信号,以使得能够从所述第一缓存器将存储的输入信号输出到语音识别引擎,或者能够从所述第二缓存器将缓存的降噪输入信号输出到语音识别引擎。10.语音处理系统,包括:输入,用于接收来自至少一个传声器的输入信号;第一信号路径,用于将所述输入连接到一个输出;第...

【专利技术属性】
技术研发人员:R·J·哈特菲尔德J·P·莱索
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:英国,GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1