激活语音处理制造技术

技术编号:13974613 阅读:67 留言:0更新日期:2016-11-11 04:33
一种处理代表语音的接收数据的方法,包括:监控该接收数据以检测代表一个触发短语的第一部分的数据在所述接收数据中的存在。在检测到代表该触发短语的该第一部分的数据时,发送一个控制信号以激活一个语音处理块。监控该接收数据以检测代表该触发短语的第二部分的数据在所述接收数据中的存在。如果先前已经发送了该控制信号以激活该语音处理块,则在检测到代表该触发短语的该第二部分的数据时,维持该语音处理块的激活。

【技术实现步骤摘要】
【国外来华专利技术】本专利技术涉及处理接收的语音数据的方法,以及用于实施这样的方法的系统,且具体地涉及用于激活语音处理的方法和系统。已知使用经由因特网访问的远程定位的语音识别算法为移动设备提供自动语音识别(ASR)。此语音识别可以被用来在移动设备上或经由移动设备识别口语命令,例如用于浏览因特网和用于控制特定功能。为了保持电池寿命,这些移动设备以功率节省待机模式度过它们的大部分时间。触发短语可以被用来唤醒设备的主处理器,使得可以在主处理器内或通过远程分析服务执行说话人验证(即,对说话的人的识别)或任何其他语音分析服务。需要在使用口语命令之前按压物理按钮在某些情况下是不期望的,因为口语命令在触觉交互不实际或不可能的情况下才具有最大价值。响应于此,移动设备可以具有常通的话音实施的唤醒。此特征是有限且非常低功率的语音识别实施方式,该语音识别实施方式仅检测用户已经说了一个预定义短语。此特征始终运行并且使用足够少的功率以至于不显著损害设备的电池寿命。因此,用户可以通过说预定义的短语来将设备从待机唤醒,在此之后设备可以指示它准备好接收语音命令以用于通过ASR解释。在设备已经成功检测到唤醒短语之后,它通常花费一个相对大量的时间,例如多达一秒,以用于系统唤醒。例如,可以通过移动设备中的应用处理器(AP)将数据传递到远程ASR服务。为了节省功率,AP被保持在低功率状态下,并且必须在它准备好捕获用于向前传输的音频之前被唤醒。因此,用户必须学习在唤醒短语和ASP命令之间留一个停顿以避免截断ASR命令的开始,或必须实施缓冲以在AP正唤醒的同时存储音频捕获物。后者将需要相对大量的数据存储器并且前者将导致高度不自然的语音模式,高度不自然的语音模式将是用户所不期望的。根据本专利技术的第一方面,提供了一种处理代表语音的接收数据的方法,包括步骤:监控该接收数据以检测代表一个触发短语的第一部分的数据在所述接收数据中的存在;当检测到代表该触发短语的该第一部分的所述数据时,发送一个控制信号以激活一个语音处理块,以及监控该接收数据以检测代表该触发短语的第二部分的数据在所述接收数据中的存在,且如果先前已经发送了所述控制信号以激活该语音处理块,则在检测到代表该触发短语的该第二部分的所述数据时,维持所述语音处理块的激活。根据本专利技术的第二方面,提供了一种语音处理器,包括:一个输入,用于接收代表语音的数据;以及一个语音处理块,其中该语音处理器被配置为执行根据第一方面的方法。根据本专利技术的第三方面,提供了一种语音处理器,包括:一个输入,用于接收代表语音的数据;以及一个输出,用于连接至一个语音处理块,其中该语音处理器被配置为执行根据第一方面的方法。根据本专利技术的第四方面,提供了一种移动设备,包括根据第二方面或第三方面的语音处理器。根据本专利技术的第五方面,提供了一种计算机程序产品,包括计算机可读代码,用于导致一个处理设备执行根据第一方面的方法。这提供的优点是,可以在完成触发短语之前唤醒语音处理块,减少了处理延迟。为了更好地理解本专利技术,以及示出如何实施本专利技术,现在将以实施例的方式参考附图,在附图中:图1是根据本专利技术的一个方面的移动设备;图2示出了图1的移动设备中的数字信号处理器的一个实施方案的更详细的视图;图3是示出了图2中的系统的操作的一个实施例的流程图;图4示出了图2中的系统的操作的又一个实施例;图5示出了图2中的系统的操作的又一个实施例;图6示出了数字信号处理器的一个替代实施方案;以及图7示出了图6中的系统的操作的又一个实施例。具体实施方式图1示出了系统10,包括具有到服务器14的连接的移动通信设备12。在一个实施方案中,服务器14可以例如包括语音识别引擎,但是将理解的是,在其他情况下可以应用其他类型的语音处理器。在此例示的实施方案中,移动设备12经由空中接口(air interface)连接到广域网36中的服务器14,尽管将理解的是,可以使用其他合适的无线连接或有线连接,或可以在移动设备12内完全地或部分地执行原本通过服务器14执行的处理,在此情况下,该移动设备可以以这样的模式操作:在该模式中,不存在与服务器的通信或移动设备可以甚至不具有与服务器通信的能力。移动设备12可以是智能手机或具有其任何功能的任何其他便携式设备,诸如便携式计算机、游戏控制台、远程控制终端或智能手表或其他可穿戴设备等。在所例示的系统中,移动设备12包含音频中枢集成电路16。音频中枢16从一个或多个麦克风18、20接收信号并且通过至少一个扬声器或音频换能器22输出信号。在此图中,存在两个麦克风18、20,但是将理解的是,可以仅存在一个麦克风,或可以存在更多麦克风。音频中枢16还从信号源24接收信号,该信号源诸如是用于存储记录的声音的存储器或无线电接收机,该信号源在移动设备处于媒体回放模式时提供信号。这些信号被传递到音频中枢16上以通过扬声器22输出。在所例示的实施例中,音频中枢16包含两个处理块26、28和一个数字信号处理器(DSP)30。第一处理块26处理从麦克风18、20接收的模拟信号,并且输出适合于在DSP 30中进一步处理的数字信号。第二处理块28处理由DSP 30输出的数字信号,并且输出适合于输入到扬声器22内的信号。DSP 30还被连接到应用处理器(AP)32。此应用处理器在移动设备12内执行多种功能,包括通过无线收发器34在广域网36上发送信号,包括发送信号到服务器14。将理解的是,许多其他构架是可能的,其中可以如下文所描述处理接收的语音数据。本专利技术的目的是用户将发出通过麦克风18、20检测的语音命令,并且通过DSP 30处理由这些麦克风输出的相应的语音数据。此经处理的信号然后可以被传输到可以例如包括语音识别引擎的服务器14。可以通过服务器14产生输出信号,或许给出对初始语音命令中由用户询问的问题的响应。此输出信号可以通过收发器(TRX)34传输回到移动设备,并且通过数字信号处理器30处理,以通过扬声器22输出以被用户听到。将理解的是,除了扬声器以外可以使用另一个用户接口来输出来自服务器14的返回信号,例如耳机或触觉换能器或显示屏幕。将理解的是,尽管在优选的实施方案中,应用处理器(AP)32将数据传输到远程定位的服务器14,在一些实施方案中,语音识别处理可以在设备12内进行,例如在应用处理器32内。图2示出了DSP 30的更详细的功能方块图。将理解的是,可以通过硬件、软件或通过硬件和软件二者的合适的组合执行在此所描述的功能,如通过DSP 30执行的功能。如下文更详细描述的,DSP 30检测用户的语音中触发短语的存在。这是一个预先确定的短语,该预先确定的短语的存在被用来启动该系统中的某些处理。因此,从通过麦克风18生成的信号导出的信号Bin被发送到触发检测块38和局部触发检测块40以用于监控。替代地,可以提供一个活动检测块,使得仅当确定输入信号包含某个最小信号活动时,数据才被发送到触发检测块38和局部触发检测块40以用于监控。信号Bin还被传递到语音增强块42。如下文更详细描述的,语音增强块42可以被维持在非激活低功率状态中,直到它被来自控制块44的信号激活时为止。触发检测块38确定接收的信号是否包含代表口语触发短语的数据,同时局部触发检测块40检测接收的信号是否包含代表口语触发短语的预先本文档来自技高网...

【技术保护点】
一种处理代表语音的接收数据的方法,包括如下步骤:监控该接收数据以检测代表一个触发短语的第一部分的数据在所述接收数据中的存在;当检测到代表该触发短语的该第一部分的所述数据时,发送一个控制信号以激活一个语音处理块;以及监控该接收数据以检测代表该触发短语的第二部分的数据在所述接收数据中的存在;且如果先前已经发送了所述控制信号以激活该语音处理块,则在检测到代表该触发短语的该第二部分的所述数据时,维持所述语音处理块的激活。

【技术特征摘要】
【国外来华专利技术】2013.12.18 GB 1322348.21.一种处理代表语音的接收数据的方法,包括如下步骤:监控该接收数据以检测代表一个触发短语的第一部分的数据在所述接收数据中的存在;当检测到代表该触发短语的该第一部分的所述数据时,发送一个控制信号以激活一个语音处理块;以及监控该接收数据以检测代表该触发短语的第二部分的数据在所述接收数据中的存在;且如果先前已经发送了所述控制信号以激活该语音处理块,则在检测到代表该触发短语的该第二部分的所述数据时,维持所述语音处理块的激活。2.根据权利要求1所述的方法,其中监控该接收数据以检测代表该触发短语的该第一部分的数据的存在的步骤和监控该接收数据以检测代表该触发短语的该第二部分的数据的存在的步骤并行地发生。3.根据权利要求1所述的方法,其中针对代表该触发短语的该第二部分的数据的存在而监控该接收数据的步骤作为检测到代表该触发短语的该第一部分的数据的结果发生。4.根据权利要求1所述的方法,其中维持该语音处理块的激活的步骤包括发送一个确认信号到该语音处理块。5.根据权利要求1所述的方法,还包括:如果未检测到代表该触发短语的第二部分的数据,则发送一个去激活命令以使该语音处理块去激活,使得,如果检测到代表该触发短语的第二部分的数据,则维持该语音处理块的激活的步骤包括不发送该去激活命令。6.根据任一项前述权利要求所述的方法,还包括:如果检测到代表该触发短语的该第二部分的数据,则发送语音数据到该语音处理块。7.根据权利要求1-5中的任一项所述的方法,还包括:如果检测到代表该触发短语的该第一部分的数据,则发送语音数据到该语音处理块。8.根据任一项前述权利要求所述的方法,还包括:在检测到代表该触发短语的该第一部分的数据之后,将该接收数据的一部分供应到一个自适应语音增强块,以及训练该语音增强块,以导出用于该语音处理块的适配参数。9.根据权利要求8所述的方法,还包括:如果检测到代表该触发短语的该第二部分的数据,则将该接收数据的至少一部分供应至用所述适配参数进行操作的该语音增强块,以及从该语音增强块输出增强的数据。10.根据权利要求8所述的方法,还包括,如果检测到代表该触发短语的该第一部分的数据,则将该接收数据的至少一部分供应至用所述适配参数进行操作...

【专利技术属性】
技术研发人员:M·佩奇
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1