激活语音处理制造技术

技术编号：13974613 阅读：67 留言：0更新日期：2016-11-11 04:33

一种处理代表语音的接收数据的方法，包括：监控该接收数据以检测代表一个触发短语的第一部分的数据在所述接收数据中的存在。在检测到代表该触发短语的该第一部分的数据时，发送一个控制信号以激活一个语音处理块。监控该接收数据以检测代表该触发短语的第二部分的数据在所述接收数据中的存在。如果先前已经发送了该控制信号以激活该语音处理块，则在检测到代表该触发短语的该第二部分的数据时，维持该语音处理块的激活。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】本专利技术涉及处理接收的语音数据的方法，以及用于实施这样的方法的系统，且具体地涉及用于激活语音处理的方法和系统。已知使用经由因特网访问的远程定位的语音识别算法为移动设备提供自动语音识别(ASR)。此语音识别可以被用来在移动设备上或经由移动设备识别口语命令，例如用于浏览因特网和用于控制特定功能。为了保持电池寿命，这些移动设备以功率节省待机模式度过它们的大部分时间。触发短语可以被用来唤醒设备的主处理器，使得可以在主处理器内或通过远程分析服务执行说话人验证(即，对说话的人的识别)或任何其他语音分析服务。需要在使用口语命令之前按压物理按钮在某些情况下是不期望的，因为口语命令在触觉交互不实际或不可能的情况下才具有最大价值。响应于此，移动设备可以具有常通的话音实施的唤醒。此特征是有限且非常低功率的语音识别实施方式，该语音识别实施方式仅检测用户已经说了一个预定义短语。此特征始终运行并且使用足够少的功率以至于不显著损害设备的电池寿命。因此，用户可以通过说预定义的短语来将设备从待机唤醒，在此之后设备可以指示它准备好接收语音命令以用于通过ASR解释。在设备已经成功检测到唤醒短语之后，它通常花费一个相对大量的时间，例如多达一秒，以用于系统唤醒。例如，可以通过移动设备中的应用处理器(AP)将数据传递到远程ASR服务。为了节省功率，AP被保持在低功率状态下，并且必须在它准备好捕获用于向前传输的音频之前被唤醒。因此，用户必须学习在唤醒短语和ASP命令之间留一个停顿以避免截断ASR命令的开始，或必须实施缓冲以在AP正唤醒的同时存储音频捕获物。后者将需要相对大量的数据存储器并且前者将导致高...

【技术保护点】
一种处理代表语音的接收数据的方法，包括如下步骤：监控该接收数据以检测代表一个触发短语的第一部分的数据在所述接收数据中的存在；当检测到代表该触发短语的该第一部分的所述数据时，发送一个控制信号以激活一个语音处理块；以及监控该接收数据以检测代表该触发短语的第二部分的数据在所述接收数据中的存在；且如果先前已经发送了所述控制信号以激活该语音处理块，则在检测到代表该触发短语的该第二部分的所述数据时，维持所述语音处理块的激活。

【技术特征摘要】
【国外来华专利技术】2013.12.18 GB 1322348.21.一种处理代表语音的接收数据的方法，包括如下步骤：监控该接收数据以检测代表一个触发短语的第一部分的数据在所述接收数据中的存在；当检测到代表该触发短语的该第一部分的所述数据时，发送一个控制信号以激活一个语音处理块；以及监控该接收数据以检测代表该触发短语的第二部分的数据在所述接收数据中的存在；且如果先前已经发送了所述控制信号以激活该语音处理块，则在检测到代表该触发短语的该第二部分的所述数据时，维持所述语音处理块的激活。2.根据权利要求1所述的方法，其中监控该接收数据以检测代表该触发短语的该第一部分的数据的存在的步骤和监控该接收数据以检测代表该触发短语的该第二部分的数据的存在的步骤并行地发生。3.根据权利要求1所述的方法，其中针对代表该触发短语的该第二部分的数据的存在而监控该接收数据的步骤作为检测到代表该触发短语的该第一部分的数据的结果发生。4.根据权利要求1所述的方法，其中维持该语音处理块的激活的步骤包括发送一个确认信号到该语音处理块。5.根据权利要求1所述的方法，还包括：如果未检测到代表该触发短语的第二部分的数据，则发送一个去激活命令以使该语音处理块去激活，使得，如果检测到代表该触发短语的第二部分的数据，则维持该语音处理块的激活的步骤包括不发送该去激活命令。6.根据任一项前述权利要求所述的方法，还包括：如果检测到代表该触发短语的该第二部分的数据，则发送语音数据到该语音处理块。7.根据权利要求1-5中的任一项所述的方法，还包括：如果检测到代表该触发短语的该第一部分的数据，则发送语音数据到该语音处理块。8.根据任一项前述权利要求所述的方法，还包括：在检测到代表该触发短语的该第一部分的数据之后，将该接收数据的一部分供应到一个自适应语音增强块，以及训练该语音增强块，以导出用于该语音处理块的适配参数。9.根据权利要求8所述的方法，还包括：如果检测到代表该触发短语的该第二部分的数据，则将该接收数据的至少一部分供应至用所述适配参数进行操作的该语音增强块，以及从该语音增强块输出增强的数据。10.根据权利要求8所述的方法，还包括，如果检测到代表该触发短语的该第一部分的数据，则将该接收数据的至少一部分供应至用所述适配参数进行操作...

【专利技术属性】
技术研发人员：M·佩奇，
申请(专利权)人：思睿逻辑国际半导体有限公司，
类型：发明
国别省市：英国;GB

全部详细技术资料下载我是这个专利的主人