用于语音识别的自适应帧跳过制造技术

技术编号:44891903 阅读:13 留言:0更新日期:2025-04-08 00:30
本文描述了用于处理音频信号的系统和技术。例如,过程可以包括:接收与第一时间帧相关联的第一音频帧。该过程还可以包括:基于第一音频帧,生成第一时间帧特征向量。该过程可以包括:确定第一时间帧特征向量和第二时间帧特征向量之间的距离。可以基于与第二时间帧相关联的第二音频帧来生成第二时间帧特征向量,其中第二时间帧在第一时间帧之前。该过程还可以包括:将第一时间帧特征向量和第二时间帧特征向量之间的距离与门限距离进行比较。该过程可以包括:基于该比较来确定是否跳过应用对第一音频帧的处理。

【技术实现步骤摘要】
【国外来华专利技术】

本申请涉及语音识别。例如,本文描述了用于执行自适应帧跳过以进行语音识别的系统和技术。


技术介绍

1、智能手机、平板电脑、可穿戴电子设备、智能电视等电子设备在消费者中越来越受欢迎。这些设备可以通过无线或有线网络提供语音和/或数据通信功能。此外,这样的电子设备可以包括提供被设计为增强用户便利性的各种功能的其它特征。电子设备可以包括用于从用户接收语音命令的语音识别功能。这样的功能允许电子设备在接收和识别来自用户的语音命令时(例如,经由关键字)执行与语音命令相关联的功能。例如,电子设备可以响应于来自用户的语音命令来激活语音助手应用程序、播放音频文件或拍照。

2、语音识别可以作为电子设备中的“常开”功能来实现,以最大限度地发挥其效用。这种常开功能需要常开软件和/或硬件资源,这反过来又导致了常开电源的使用。移动电子设备、物联网(iot)设备等对这种常开电源需求特别敏感,因为它们会缩短电池寿命并消耗系统的其它有限资源,如处理能力。


技术实现思路

1、本文描述了用于处理音频信号的系统和技术。根据一些方面,该系统和本文档来自技高网...

【技术保护点】

1.一种用于处理音频信号的装置,包括:

2.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为:基于关于所述第一时间帧特征向量和所述第二时间帧特征向量之间的所述距离小于所述门限距离的确定,来确定不处理所述第一音频帧。

3.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为确定是否跳过关键词检测应用对所述第一音频帧的处理。

4.根据权利要求3所述的装置,其中,所述至少一个处理器被配置为:基于关于所述第一时间帧特征向量和所述第二时间帧特征向量之间的所述距离大于所述门限距离的确定,确定使用机器学习模型来处理所述第一时间帧特征向量以检测关键词。...

【技术特征摘要】
【国外来华专利技术】

1.一种用于处理音频信号的装置,包括:

2.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为:基于关于所述第一时间帧特征向量和所述第二时间帧特征向量之间的所述距离小于所述门限距离的确定,来确定不处理所述第一音频帧。

3.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为确定是否跳过关键词检测应用对所述第一音频帧的处理。

4.根据权利要求3所述的装置,其中,所述至少一个处理器被配置为:基于关于所述第一时间帧特征向量和所述第二时间帧特征向量之间的所述距离大于所述门限距离的确定,确定使用机器学习模型来处理所述第一时间帧特征向量以检测关键词。

5.根据权利要求3所述的装置,其中,所述至少一个处理器被配置为:

6.根据权利要求5所述的装置,其中,所述至少一个处理器被配置为:

7.根据权利要求5所述的装置,其中,所述至少一个处理器被配置为:

8.根据权利要求5所述的装置,其中,所述至少一个处理器被配置为将所述第二帧得分和所述第三帧得分存储在所述存储器中。

9.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为基于以下各项之一来确定所述第一时间帧特征向量和所述第二时间帧特征向量之间的所述距离:

10.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为将所述第一时间帧特征向量存储在所述存储器中,以用于与稍后接收的音频帧的时间帧特征向量进行比较。

11.根据权利要求1所述的装置,其中,所述第一时间帧特征向量指示所接收的第一音频帧的特性。

12.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为确定是否跳过噪声抑制应用对所述第一音频帧的处理。

13.根据权利要求1所述的装置,其中,所述第二时间帧在所述第一时间帧之前。

14.根据权利要求1所述的装置,其中,所述至少一个处理器被配置为基于所述比较,来确定是否跳过机器学习模型对所述第一音频帧的处理。

15.一种用于处理音频信号的方法,包括:

16.根据权利要求15所述的方法,还包括:基于关于所述第一时间帧特征向量和所述第二时间帧特征向量之间的所述距离小于所述门限距离的确定,来确定不处理所述第一音频帧。

17.根据权利要求15所述的方法,还包括:确定是否跳过关键词检测应用对所述第一音频帧的处理。

18.根据权利要求17所述的方法,还包括:基于关于所述第一时间帧特征向量和所述第二时间帧特征向量之间的所述距离大于所述门限距离的确定,确定使用机器学习模型来处理所述第一时间帧特征向量以检测关键词。

19.根据权利要求17所述的方法,还包括:

20.根据权利要求19所述的方法,还包括:

21.根据权利要求19所述的方法,还包括:

22.根据权利要求19所述的方法,还包括:将所述第二帧得分和所述第三帧得分存储在存储器中。

23.根据权利要求15所述的方法,其中,所述第一时间帧特征向量和所述第二时间帧特征向量之间的距离是基于以下各项之一来确定的:

24.根据权利要求15...

【专利技术属性】
技术研发人员:U·R·图马卢里S·阿布达吉尔P·武普
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1