音频信号处理方法和设备技术

技术编号:18501600 阅读:28 留言:0更新日期:2018-07-21 22:50
本发明专利技术涉及用于处理音频信号的方法和设备。本发明专利技术提供一种音频信号处理方法和使用该方法的音频信号处理设备,该音频信号处理方法包括下述步骤:接收包括多声道信号的输入音频信号;接收根据频域的每个子带可变地确定的滤波器阶数信息;基于用于输入音频信号的双耳滤波的滤波系数的每个子带的快速傅立叶变换长度,来接收关于每个子带的块长度信息;以相应子带的块为单位接收输入音频信号的每个子带和每个声道的频域可变阶数滤波(VOFF)系数,其中,对应于相同子带和相同声道的VOFF系数的总长度基于相应子带的滤波器阶数信息来确定,并且通过使用所接收的VOFF系数来滤波输入音频信号的每个子带信号以生成双耳输出信号。

Audio signal processing method and equipment

The invention relates to a method and device for processing audio signals. The present invention provides an audio signal processing method and an audio signal processing device using the same method. The audio signal processing method includes the following steps: receiving an input audio signal including a multichannel signal; receiving a filter order information determined alterably according to each subband in the frequency domain; based on an input audio signal. The fast Fu Liye transform length of each subband of the filter coefficients of the binear filter is used to receive the block length information about each subband, and the frequency variable order filter (VOFF) coefficients of each subband of the input audio signal and each channel are received in units of the corresponding subband, in which the same subband and the same channel are corresponding to the same subband. The total length of the VOFF coefficient is determined based on the filter order information of the corresponding subband and is used to filter each subband signal of the input audio signal by using the received VOFF coefficients to generate a binaural output signal.

【技术实现步骤摘要】
音频信号处理方法和设备分案声明本申请是申请日为2015年4月2日、专利技术名称为“音频信号处理方法和设备”、申请号为:201580019062.X的中国专利技术专利申请的分案申请。
本专利技术涉及用于处理音频信号的方法和设备,并且更具体地,涉及将对象信号与声道信号合成并且有效地执行合成信号的双耳渲染的用于处理音频信号的方法和设备。
技术介绍
在现有技术中,3D音频统称为一系列信号处理、传输、编码和再现技术,该一系列信号处理、传输、编码和再现技术用于通过向在环绕音频中提供的水平面(2D)上的声音场景提供与高度方向对应的另一轴,来提供出现在3D空间中的声音。具体地,为了提供3D音频,应当使用比相关技术更多的扬声器,或者以其他方式,尽管使用了比相关技术更少的扬声器,但是需要在不存在扬声器的虚拟位置处产生声音图像的渲染技术。预计3D音频将是与超高清(UHD)TV对应的音频解决方案,并且预计3D音频将应用于各种领域,除了在演进为高品质的信息娱乐空间的车辆中的声音之外,还包括影院音响、个人3DTV、平板装置、智能手机和云游戏。同时,作为提供给3D音频的声源的类型,可以存在基于声道的信号和基于对象的信号。另外,可以存在基于声道的信号和基于对象的信号被混合的声源,并且因此,用户可以具有新型的收听体验。
技术实现思路
技术问题本专利技术致力于实现一种滤波过程,该滤波过程在最小化在双耳渲染中的音质损失的同时,要求具有非常小的计算量的高计算量,以便在以立体声再现多声道或者多对象信号时保持原始信号的沉浸感。本专利技术还致力于在输入信号中包含失真时通过高质量滤波器来最小化失真传播。本专利技术还致力于实现具有非常大的长度的有限脉冲响应(FIR)滤波器作为具有较小长度的滤波器。本专利技术还致力于在使用缩小FIR的滤波器执行滤波时通过省略的滤波器系数来最小化截断部分(destructedpart)的失真。技术解决方案为了实现这些目的,本专利技术提供如下用于处理音频信号的方法和装置。本专利技术的示例性实施例提供一种用于处理音频信号的方法,包括:接收包括多声道信号和多对象信号中的至少一个的输入音频信号;接收用于所述输入音频信号的双耳滤波的滤波器集合的类型信息,滤波器集合的类型是有限脉冲响应(FIR)滤波器、频域中的参数化滤波器和时域中的参数化滤波器中的一个;基于所述类型信息来接收用于双耳滤波的滤波器信息;以及通过使用所接收的滤波器信息,来执行用于所述输入音频信号的双耳滤波,其中,当所述类型信息指示频域中的参数化滤波器时,在接收滤波器信息中,接收具有对频域的每个子带确定的长度的子带滤波器系数,并且在执行双耳滤波中,通过使用与之对应的子带滤波器系数,来滤波所述输入音频信号的每个子带信号。本专利技术的另一示例性实施例提供一种用于处理音频信号的装置,该装置用于执行包括多声道信号和多对象信号中的至少一个的输入音频信号的双耳渲染,其中,用于处理音频信号的装置接收用于输入音频信号的双耳滤波的滤波器集合的类型信息,滤波器集合的类型是有限脉冲响应(FIR)滤波器、频域中的参数化滤波器和时域中的参数化滤波器中的一个;基于所述类型信息来接收用于双耳滤波的滤波器信息,并且通过使用所接收的滤波器信息来执行用于输入音频信号的双耳滤波,并且其中,当类型信息指示频域中的参数化滤波器时,用于处理音频信号的装置接收具有对频域的每个子带确定的长度的子带滤波器系数,并且通过使用与之对应的子带滤波器系数,来滤波所述输入音频信号的每个子带信号。每个子带滤波器系数的长度可以基于从原型滤波器系数获得的相应子带的混响时间信息来确定,并且从相同原型滤波器系数获得的至少一个子带滤波器系数的长度可以不同于另一子带滤波器系数的长度。该方法可以进一步包括:当类型信息指示频域中的参数化滤波器时,接收有关用于执行双耳渲染的频带的数目的信息和有关用于执行卷积的频带的数目的信息;接收用于相对于具有用于执行卷积的频带的高频子带组的每个子带信号执行抽头延迟线滤波的参数作为边界;以及通过使用所接收的参数来对高频率组的每个子带信号执行抽头延迟线滤波。在这种情况下,可以基于在用于执行双耳渲染的频带的数目和用于执行卷积的频带的数目之间的差,来确定执行抽头延迟线滤波的高频子带组的子带的数目。参数可以包括从对应于高频率组的每个子带信号的子带滤波器系数中提取的延迟信息和对应于所述延迟信息的增益信息。当类型信息指示FIR滤波器时,接收滤波器信息的步骤接收对应于输入音频信号的每个子带信号的原型滤波器系数。本专利技术的又一示例性实施例提供一种用于处理音频信号的方法,包括:接收包括多声道信号的输入音频信号;接收对频域的每个子带变化地确定的滤波器阶数信息;基于用于输入音频信号的双耳滤波的滤波器系数的每个子带的快速傅立叶变换长度来接收用于每个子带的块长度信息;接收对应于每相应子带的块的输入音频信号的每个子带和每个声道的频域可变阶数滤波(VOFF)系数,VOFF系数的长度的总和对应于基于相应子带的滤波器阶数信息确定的同一子带和同一声道;以及通过使用所接收的VOFF系数来滤波输入音频信号的每个子带信号以生成双耳输出信号。本专利技术的又一示例性实施例提供一种用于处理音频信号的装置,该装置用于执行包括多声道信号的输入音频信号的双耳渲染,该装置包括:快速卷积单元,被配置为执行用于输入音频信号的直达声部分和早期反射声部分的渲染,其中,快速卷积单元接收输入音频信号,接收对频域的每个子带变化地确定的滤波器阶数信息,基于用于输入音频信号的双耳滤波的滤波器系数的每个子带的快速傅立叶变换长度来接收用于每个子带的块长度信息,接收对应于每相应子带的块的输入音频信号的每个子带和每个声道的频域可变阶数滤波(VOFF)系数,VOFF系数的长度的总和对应于基于相应子带的滤波器阶数信息确定的同一子带和同一声道;以及通过使用所接收的VOFF系数来滤波输入音频信号的每个子带信号以生成双耳输出信号。在这种情况下,滤波器阶数可以基于从原型滤波器系数获得的相应子带的混响时间信息来确定,并且从同一原型滤波器系数获得的至少一个子带的滤波器阶数可以不同于另一子带的滤波器阶数。每块的VOFF系数的长度可以被确定为具有作为索引值的相应子带的块长度信息的2的幂的值。生成双耳输出信号可以包括将子带信号的每个帧划分成基于预定的块长度确定的子帧单元,并且执行在划分的子帧和VOFF系数之间的快速卷积。在这种情况下,子帧的长度可以被确定为预定块长度的一半大的值,并且划分的子帧的数目可以基于通过将帧的总长除以子帧的长度获得的值来确定。有益效果根据本专利技术的示例性实施例,当执行对多声道或者多对象信号的双耳渲染时,可以显著减少计算量,同时最小化音质损失。另外,能够对多声道或者多对象音频信号实现具有高音质的双耳渲染,而在现有技术的低功率装置中已经不可能进行这种实时处理。本专利技术提供了一种以小的计算量来有效地执行对包括音频信号的各种类型的多媒体信号进行滤波的方法。附图说明图1是示出根据本专利技术的示例性实施例的音频信号解码器的框图。图2是示出根据本专利技术的示例性实施例的双耳渲染器的每个组件的框图。图3是示出根据本专利技术的示例性实施例的用于生成用于双耳渲染的滤波器的方法的图。图4是示出根据本专利技术的示例性实施例的具体QTDL处理的图。图5是示出本专利技术的实施例的B本文档来自技高网...

【技术保护点】
1.一种用于处理音频信号的方法,所述方法包括:接收包括多声道信号的输入音频信号;接收针对频域的每个子带可变地确定的滤波器阶数信息;基于用于所述输入音频信号的双耳滤波的滤波器系数的每个子带的快速傅立叶变换长度,来接收每个子带的块长度信息;每相应子带的块地接收对应于所述输入音频信号的每个子带和每个声道的频域可变阶数滤波(VOFF)系数,所述VOFF系数的长度的总和对应于基于所述相应子带的滤波器阶数信息所确定的相同子带和相同声道;以及通过使用所接收的VOFF系数来对所述输入音频信号的每个子带信号进行滤波,以生成双耳输出信号。

【技术特征摘要】
2014.06.30 KR 10-2014-0081226;2014.04.02 US 61/9731.一种用于处理音频信号的方法,所述方法包括:接收包括多声道信号的输入音频信号;接收针对频域的每个子带可变地确定的滤波器阶数信息;基于用于所述输入音频信号的双耳滤波的滤波器系数的每个子带的快速傅立叶变换长度,来接收每个子带的块长度信息;每相应子带的块地接收对应于所述输入音频信号的每个子带和每个声道的频域可变阶数滤波(VOFF)系数,所述VOFF系数的长度的总和对应于基于所述相应子带的滤波器阶数信息所确定的相同子带和相同声道;以及通过使用所接收的VOFF系数来对所述输入音频信号的每个子带信号进行滤波,以生成双耳输出信号。2.如权利要求1所述的方法,其中,基于从原型滤波器系数获得的所述相应子带的混响时间信息来确定所述滤波器阶数,并且从相同原型滤波器系数获得的至少一个子带的滤波器阶数不同于另一子带的滤波器阶数。3.如权利要求1所述的方法,其中,每块的VOFF系数的长度被确定为具有作为指数值的所述相应子带的块长度信息的2的幂的值。4...

【专利技术属性】
技术研发人员:吴贤午李泰圭徐廷一
申请(专利权)人:韦勒斯标准与技术协会公司韩国电子通信研究院
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1