用于降低信号延时的音频信号处理方法、装置及存储介质制造方法及图纸

技术编号：32138890 阅读：29 留言：0更新日期：2022-02-08 14:32

本申请公开了一种音频信号处理方法，音频信号处理方法包括：提供输入音频信号，所述输入音频信号包括以预定帧移相互偏移且具有预定帧长的多个输入数据帧；以第一窗函数依序对所述多个输入数据帧进行第一加窗处理；对第一加窗处理后的输入音频信号进行预定信号处理，并生成输出音频信号；其中所述输出音频信号具有与所述输入音频信号的多个输入数据帧对应的多个输出数据帧，并且所述多个输出数据帧具有所述预定帧长；以第二窗函数依序对所述多个输出数据帧进行第二加窗处理；以及，以所述预定帧移叠加地输出经第二加窗处理的所述多个输出数据帧。输出数据帧。输出数据帧。

全部详细技术资料下载

【技术实现步骤摘要】
用于降低信号延时的音频信号处理方法、装置及存储介质

[0001]本申请涉及音频处理技术，更具体地，涉及一种用于降低信号延时的音频信号处理方法、装置及存储介质。

技术介绍

[0002]在音频设备中，音频信号的处理过程中的信号延时是不期望的，特别是对于某些实时性要求较高的应用，例如助听设备，从音频输入到音频输出的总系统延时期待尽量控制在10毫秒以下，最慢不能超过20毫秒，否则将对语言识别造成影响。然而，现有的音频设备往往难以满足前述的低延时的要求。
[0003]因此，有必要提供一种用于音频设备的音频信号处理方法，以解决现有技术中延时较高的问题。

技术实现思路

[0004]本申请的一个目的在于提供一种用于降低信号延时的音频信号处理方法。
[0005]在本申请的一个方面，提供了一种音频信号处理方法，包括：提供输入音频信号，所述输入音频信号包括以预定帧移相互偏移且具有预定帧长的多个输入数据帧；以第一窗函数依序对所述多个输入数据帧进行第一加窗处理，所述第一窗函数在其起始端点与终止端点处分别对准每个输入数据...

【技术保护点】

【技术特征摘要】
1.一种音频信号处理方法，其特征在于，所述音频信号处理方法包括：提供输入音频信号，所述输入音频信号包括以预定帧移相互偏移且具有预定帧长的多个输入数据帧；以第一窗函数依序对所述多个输入数据帧进行第一加窗处理，所述第一窗函数在其起始端点与终止端点处分别对准每个输入数据帧的两端；其中，所述第一窗函数包括位于其起始区域的起始函数部分、位于其终止区域的终止函数部分以及位于其中间区域的中间函数部分，所述中间区域位于所述起始区域与所述终止区域之间；并且其中，所述中间函数部分具有第一加权系数，所述起始函数部分从所述起始端点处的0变化为邻接所述中间区域的第一加权系数，所述终止函数部分从邻接所述中间区域的第一加权系数变化为所述终止端点处的0；对第一加窗处理后的输入音频信号进行预定信号处理，并生成输出音频信号；其中所述输出音频信号具有与所述输入音频信号的多个输入数据帧对应的多个输出数据帧，并且所述多个输出数据帧具有所述预定帧长；以第二窗函数依序对所述多个输出数据帧进行第二加窗处理，所述第二窗函数在其起始端点和终止端点分别对准每个输出数据帧的两端；其中，所述第二窗函数包括位于其抑制区域的抑制函数部分、位于其输出区域的输出函数部分以及位于其补偿区域的补偿函数部分，所述补偿区域位于所述抑制区域与所述输出区域之间，所述输出区域的长度等于所述终止区域的长度；并且其中，所述抑制函数部分起始于所述起始端点处的0且用于抑制信号输出；所述输出函数部分终止于所述终止端点处的0；所述补偿函数部分用于提供与所述输出函数部分相关的信号加权并且补偿所述终止函数部分与所述第一加权系数之间的信号加权差异，并且其从邻接所述抑制区域的抑制函数部分变化为邻接所述输出区域的所述输出函数部分；以及以所述预定帧移叠加地输出经第二加窗处理的所述多个输出数据帧。2.根据权利要求1所述的音频信号处理方法，其特征在于，每个输入数据帧和每个输出数据帧分别包括N个分段，其中N为不小于2的整数。3.根据权利要求2所述的音频信号处理方法，其特征在于，所述N个分段具有相等的长度，所述预定帧移等于所述分段的长度。4.根据权利要求3所述的音频信号处理方法，其特征在于，所述起始区域、终止区域、补偿区域和输出区域的长度均等于一个分段的长度。5.根据权里要求4所述的音频信号处理方法，其特征在于，所述抑制区域的长度等于一个或多个分段的长度。6.根据权利要求4所述的音频信号处理方法，其特征在于，所述中间区域的长度等于一个或多个分段的长度。7.根据权利要求1所述的音频信号处理方法，其特征在于，所述第一加权系数等于或小于1。8.根据权利要求7所述的音频信号处理方法，其特征在于，所述补偿函数部分是所述终止函数部分与所述输出函数部分的乘积再除以第一加权系数的商。9.根据权利要求1所述的音频信号处理方法，其特征在于，每个输入数据帧包括M个分段，每个输出数据帧包括N个分段，其中M和N为不小于2的整数，所述M个分段中的至少一部
分分段具有不相等的长度，所述N个分段中的至少一部分分段具有不相等的长度，并且所述预定帧移等于所述输入数据帧的M个分段中最后输入的分段的长度、并且等于所述输出数据帧的N个分段中最后输出的分段的长度。10.根据权利要求9所述的音频信号处理方法，其特征在于，M和N不相等。11.根据权利要求1所述的音频信号处理方法，其特征在于，所述抑制函数部分在所述抑制区域保持为0。12.根据权利要求1至11中任一项所述的音频信号处理方法，其特征在于，所述第一窗函数的起始函数部分拟合汉宁窗函数的起始半侧的函数部分，所述第一窗函数的终止函数部分拟合汉宁窗函数的终止半侧的函数部分。13.根据权利要求12所述的音频信号处理方法，其特征在于，所述第二窗函数的输出函数部分拟合汉宁窗函数的终止半侧的函数部分。14.根据权利要求1至11中任一项所述的音频信号处理方法，其特征在于，所述第一窗函数的起始函数部分拟合平顶窗函数的起始半侧的函数部分，所述第一窗函数的终止函数部分拟合平顶窗函数的终止半侧的函数部分。15.根据权利要求14所述的音频信号处理方法，其特征在于，所述第二窗函数的输出函数部分拟合平顶窗函数的终止半侧的函数部分。16.根据权利要求1至11中任一项所述的音频信号处理方法，其特征在于，所述第二窗函数的输出函数...

【专利技术属性】
技术研发人员：陆丛希，李林锴，袁宇帆，孙鸿程，
申请(专利权)人：上海又为智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人