用于降低信号延时的音频信号处理方法、装置及存储介质制造方法及图纸

技术编号:32138890 阅读:16 留言:0更新日期:2022-02-08 14:32
本申请公开了一种音频信号处理方法,音频信号处理方法包括:提供输入音频信号,所述输入音频信号包括以预定帧移相互偏移且具有预定帧长的多个输入数据帧;以第一窗函数依序对所述多个输入数据帧进行第一加窗处理;对第一加窗处理后的输入音频信号进行预定信号处理,并生成输出音频信号;其中所述输出音频信号具有与所述输入音频信号的多个输入数据帧对应的多个输出数据帧,并且所述多个输出数据帧具有所述预定帧长;以第二窗函数依序对所述多个输出数据帧进行第二加窗处理;以及,以所述预定帧移叠加地输出经第二加窗处理的所述多个输出数据帧。输出数据帧。输出数据帧。

【技术实现步骤摘要】
用于降低信号延时的音频信号处理方法、装置及存储介质


[0001]本申请涉及音频处理技术,更具体地,涉及一种用于降低信号延时的音频信号处理方法、装置及存储介质。

技术介绍

[0002]在音频设备中,音频信号的处理过程中的信号延时是不期望的,特别是对于某些实时性要求较高的应用,例如助听设备,从音频输入到音频输出的总系统延时期待尽量控制在10毫秒以下,最慢不能超过20毫秒,否则将对语言识别造成影响。然而,现有的音频设备往往难以满足前述的低延时的要求。
[0003]因此,有必要提供一种用于音频设备的音频信号处理方法,以解决现有技术中延时较高的问题。

技术实现思路

[0004]本申请的一个目的在于提供一种用于降低信号延时的音频信号处理方法。
[0005]在本申请的一个方面,提供了一种音频信号处理方法,包括:提供输入音频信号,所述输入音频信号包括以预定帧移相互偏移且具有预定帧长的多个输入数据帧;以第一窗函数依序对所述多个输入数据帧进行第一加窗处理,所述第一窗函数在其起始端点与终止端点处分别对准每个输入数据帧的两端;其中,所述第一窗函数包括位于其起始区域的起始函数部分、位于其终止区域的终止函数部分以及位于其中间区域的中间函数部分,所述中间区域位于所述起始区域与所述终止区域之间;并且其中,所述中间函数部分具有第一加权系数,所述起始函数部分从所述起始端点处的0变化为邻接所述中间区域的第一加权系数,所述终止函数部分从邻接所述中间区域的第一加权系数变化为所述终止端点处的0;对第一加窗处理后的输入音频信号进行预定信号处理,并生成输出音频信号;其中所述输出音频信号具有与所述输入音频信号的多个输入数据帧对应的多个输出数据帧,并且所述多个输出数据帧具有所述预定帧长;以第二窗函数依序对所述多个输出数据帧进行第二加窗处理,所述第二窗函数在其起始端点和终止端点分别对准每个输出数据帧的两端;其中,所述第二窗函数包括位于其抑制区域的抑制函数部分、位于其输出区域的输出函数部分以及位于其补偿区域的补偿函数部分,所述补偿区域位于所述抑制区域与所述输出区域之间,所述输出区域的长度等于所述终止区域的长度;并且其中,所述抑制函数部分起始于所述起始端点处的0且用于抑制信号输出;所述输出函数部分终止于所述终止端点处的0;所述补偿函数部分用于提供与所述输出函数部分相关的信号加权并且补偿所述终止函数部分与所述第一加权系数之间的信号加权差异,并且其从邻接所述抑制区域的抑制函数部分变化为邻接所述输出区域的所述输出函数部分;以及以所述预定帧移叠加地输出经第二加窗处理的所述多个输出数据帧。
[0006]在本申请的其他方面,还提供一种音频信号处理装置和非暂态计算机存储介质。
[0007]以上为本申请的概述,可能有简化、概括和省略细节的情况,因此本领域的技术人
员应该认识到,该部分仅是示例说明性的,而不旨在以任何方式限定本申请范围。本概述部分既非旨在确定所要求保护主题的关键特征或必要特征,也非旨在用作为确定所要求保护主题的范围的辅助手段。
附图说明
[0008]通过下面说明书和所附的权利要求书并与附图结合,将会更加充分地清楚理解本申请内容的上述和其他特征。可以理解,这些附图仅描绘了本申请内容的若干实施方式,因此不应认为是对本申请内容范围的限定。通过采用附图,本申请内容将会得到更加明确和详细地说明。
[0009]图1示出了现有音频设备的音频信号处理链路中信号延时的组成;
[0010]图2示出了根据本申请一个实施例的音频设备的模块示意图;
[0011]图3示出了根据本申请一个实施例的示例性音频信号被处理的过程;
[0012]图4a和图4b示出了图3所示的第一窗函数和第二窗函数的放大示意图;
[0013]图5a和图5b示出了根据本申请一个实施例的第一窗函数和第二窗函数的另一示例;
[0014]图6示出了输入数据帧与输出数据帧具有不等长度的分段的示例。。
具体实施方式
[0015]在下面的详细描述中,参考了构成其一部分的附图。在附图中,类似的符号通常表示类似的组成部分,除非上下文另有说明。详细描述、附图和权利要求书中描述的说明性实施方式并非旨在限定。在不偏离本申请的主题的精神或范围的情况下,可以采用其他实施方式,并且可以做出其他变化。可以理解,可以对本申请中一般性描述的、在附图中图解说明的本申请内容的各个方面进行多种不同构成的配置、替换、组合,设计,而所有这些都明确地构成本申请内容的一部分。
[0016]图1示出了现有音频设备的音频信号处理链路中信号延时的组成。该现有音频设备的音频信号处理链路可以包括音频采集模块、信号处理模块以及音频播放模块,这些模块对音频信号进行处理的过程会引入各种类型的信号延时。
[0017]具体地,音频采集模块用于对模拟形式的原始音频信号进行采集,并生成对应的数字格式的音频数据点。通常来说,音频采集模块可以以预定的采样率,例如16kHz,对原始音频信号进行采样,并且可以按照预定帧长,例如10毫秒,来对采集生成的音频数据点进行分帧,从而生成具有预定帧长的多个输入数据帧,这些连续的多个输入数据帧即构成了输入音频信号。每个输入数据帧可以包括对应数量的音频数据点。例如,在以16kHz采样率采集音频信号并且帧长为10毫秒的情况下,每个输入数据帧可以具有160个音频数据点。可以理解,在前述的例子中帧长被表示为时间长度,在另一些情况下,帧长也可以被表示为音频数据点的数量,例如帧长为160个音频数据点或256个音频数据点,此时音频数据点的采样率与每帧音频数据点的数量对应于以时间长度表示的帧长。
[0018]音频采集模块对原始音频信号的采集会引入音频采集延时101。对于一些现有的音频设备,其音频采集模块仅在产生一个输入数据帧之后,才会继续对原始音频信号继续进行采集,并且生成下一个输入数据帧。这意味着每两个相邻的输入数据帧是不相互重叠
的,因此这时音频采集模块引入的音频采集延时101等于输入数据帧的帧长。此外,在音频采集过程中还会引入硬件输入延时103,其取决于模拟/数字信号的转换延时,通常为1-2毫秒。在此之后,采集生成的输入音频信号会被发送给信号处理模块,并且由信号处理模块基于预定的信号处理算法对输入音频信号进行处理,这会引入算法处理延时105。算法处理延时105通常与帧长成比例,例如为帧长的0.2至0.5倍。输出音频信号可以具有与输入音频信号相同的帧长,例如,输出音频信号可以包括均具有预定帧长的多个输出数据帧。输出音频信号会被发送给音频播放模块,并且由音频播放模块播放以供音频设备的使用者收听。在此过程中,音频播放模块会引入硬件输出延时107以及音频播放延时109。其中,与硬件输入延时103类似,硬件输出延时107主要取决于音频信号的数字/模拟转换,其通常为1-2毫秒。在该现有音频设备中,音频播放模块对输出音频信号的播放和处理是以输出数据帧为单位的,也即在接收到每个输出数据帧之后,音频播放模块才会播放该输出数据帧的内容,因此音频播放延时109也等于输出数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,所述音频信号处理方法包括:提供输入音频信号,所述输入音频信号包括以预定帧移相互偏移且具有预定帧长的多个输入数据帧;以第一窗函数依序对所述多个输入数据帧进行第一加窗处理,所述第一窗函数在其起始端点与终止端点处分别对准每个输入数据帧的两端;其中,所述第一窗函数包括位于其起始区域的起始函数部分、位于其终止区域的终止函数部分以及位于其中间区域的中间函数部分,所述中间区域位于所述起始区域与所述终止区域之间;并且其中,所述中间函数部分具有第一加权系数,所述起始函数部分从所述起始端点处的0变化为邻接所述中间区域的第一加权系数,所述终止函数部分从邻接所述中间区域的第一加权系数变化为所述终止端点处的0;对第一加窗处理后的输入音频信号进行预定信号处理,并生成输出音频信号;其中所述输出音频信号具有与所述输入音频信号的多个输入数据帧对应的多个输出数据帧,并且所述多个输出数据帧具有所述预定帧长;以第二窗函数依序对所述多个输出数据帧进行第二加窗处理,所述第二窗函数在其起始端点和终止端点分别对准每个输出数据帧的两端;其中,所述第二窗函数包括位于其抑制区域的抑制函数部分、位于其输出区域的输出函数部分以及位于其补偿区域的补偿函数部分,所述补偿区域位于所述抑制区域与所述输出区域之间,所述输出区域的长度等于所述终止区域的长度;并且其中,所述抑制函数部分起始于所述起始端点处的0且用于抑制信号输出;所述输出函数部分终止于所述终止端点处的0;所述补偿函数部分用于提供与所述输出函数部分相关的信号加权并且补偿所述终止函数部分与所述第一加权系数之间的信号加权差异,并且其从邻接所述抑制区域的抑制函数部分变化为邻接所述输出区域的所述输出函数部分;以及以所述预定帧移叠加地输出经第二加窗处理的所述多个输出数据帧。2.根据权利要求1所述的音频信号处理方法,其特征在于,每个输入数据帧和每个输出数据帧分别包括N个分段,其中N为不小于2的整数。3.根据权利要求2所述的音频信号处理方法,其特征在于,所述N个分段具有相等的长度,所述预定帧移等于所述分段的长度。4.根据权利要求3所述的音频信号处理方法,其特征在于,所述起始区域、终止区域、补偿区域和输出区域的长度均等于一个分段的长度。5.根据权里要求4所述的音频信号处理方法,其特征在于,所述抑制区域的长度等于一个或多个分段的长度。6.根据权利要求4所述的音频信号处理方法,其特征在于,所述中间区域的长度等于一个或多个分段的长度。7.根据权利要求1所述的音频信号处理方法,其特征在于,所述第一加权系数等于或小于1。8.根据权利要求7所述的音频信号处理方法,其特征在于,所述补偿函数部分是所述终止函数部分与所述输出函数部分的乘积再除以第一加权系数的商。9.根据权利要求1所述的音频信号处理方法,其特征在于,每个输入数据帧包括M个分段,每个输出数据帧包括N个分段,其中M和N为不小于2的整数,所述M个分段中的至少一部
分分段具有不相等的长度,所述N个分段中的至少一部分分段具有不相等的长度,并且所述预定帧移等于所述输入数据帧的M个分段中最后输入的分段的长度、并且等于所述输出数据帧的N个分段中最后输出的分段的长度。10.根据权利要求9所述的音频信号处理方法,其特征在于,M和N不相等。11.根据权利要求1所述的音频信号处理方法,其特征在于,所述抑制函数部分在所述抑制区域保持为0。12.根据权利要求1至11中任一项所述的音频信号处理方法,其特征在于,所述第一窗函数的起始函数部分拟合汉宁窗函数的起始半侧的函数部分,所述第一窗函数的终止函数部分拟合汉宁窗函数的终止半侧的函数部分。13.根据权利要求12所述的音频信号处理方法,其特征在于,所述第二窗函数的输出函数部分拟合汉宁窗函数的终止半侧的函数部分。14.根据权利要求1至11中任一项所述的音频信号处理方法,其特征在于,所述第一窗函数的起始函数部分拟合平顶窗函数的起始半侧的函数部分,所述第一窗函数的终止函数部分拟合平顶窗函数的终止半侧的函数部分。15.根据权利要求14所述的音频信号处理方法,其特征在于,所述第二窗函数的输出函数部分拟合平顶窗函数的终止半侧的函数部分。16.根据权利要求1至11中任一项所述的音频信号处理方法,其特征在于,所述第二窗函数的输出函数...

【专利技术属性】
技术研发人员:陆丛希李林锴袁宇帆孙鸿程
申请(专利权)人:上海又为智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1