当前位置: 首页 > 专利查询>武汉大学专利>正文

空间音频参数双向帧间预测编解码装置制造方法及图纸

技术编号:3826937 阅读:168 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了空间音频参数双向帧间预测编解码装置。其中编码装置包括空间音频参数提取模块,用于对输入的多声道音频信号的帧信号分子带提取空间音频参数;空间音频参数预测模块,用于得到当前帧的空间音频参数的预测系数和预测残差;空间音频参数编码模块,用于将当前帧的空间音频参数的预测系数和预测残差进行编码。其中解码装置包括空间音频参数解码模块,用于从编码码流的帧信号中得到该帧的空间音频参数的预测系数和预测残差;空间音频参数重建模块,用于重建得到当前帧的空间音频参数。本发明专利技术考虑了空间音频参数的时域相关性,可有效降低编码码率。

【技术实现步骤摘要】

本专利技术属于音频
,特别是涉及空间音频参数双向帧间编解码预测 装置。
技术介绍
在空间音频编码技术里,空间音频参数表达了多声道(含立体声)音频中 蕴涵的空间信息,如双耳声强差、双耳时间差、双耳相关度。其中双耳声强差(Interaural Level Difference,以下简称ILD)参数表 达了声道间强差对声源方向定位的影响。简单说来,如果左耳感受到的声音强 度比右耳的大,那么听音人会觉得声音来自左侧方向,反之亦然。双耳时间差(Interaural Time Difference,以下简称ITD)参数表达了声 道间时间差对声源方向定位的影响。简单说来,从声源发出的声音到达人的左 耳和右耳时,有一个先后的过程,这段时间差就是双耳时间差。它的原理是-如果一个声音到达双耳的时间是同时的,那么听者就觉得这个声音处在正中间 的位置;倘若声音到达左耳先于到达右耳,听者人就觉得声源偏左,反之亦然。。双耳相关度(Interaural Correlation,以下简称IC)参数控制着声场宽 度,在实际编码应用中被定义为声道间的相关系数,其数值在0和1之间。简 单说来,当IC较小时,声道间信号相关性较小,双耳感知到的是面声源,给人 一种开阔的听觉感受;当IC较大时,声道间信号相关性较大,双耳感知到的是 点声源,给人一种集中的听觉感受。通常认为语音频信号是瞬变信号,因此前一帧的参数对当前帧没有意义。 但空间音频参数有其特殊性。因为音频对象在空间的移动通常是一个连续过程, 表征音频对象空间方位的音频空间音频参数在时域前后帧存在着相关性。现有 空间音频编码技术通过双声道下混和声道间的差异分析,提取空间音频参数进 行编码,没有考虑到空间音频参数在时域上前后帧之间的相关性,导致在处理 空间方位连续变化的音频信号时存在较大冗余。
技术实现思路
本专利技术目的在于利用基于空间音频参数的时域相关性,提出空间音频参数 的线性预测分析技术方案,通过前后若干帧的空间音频参数预测当前帧的空间 参数,在预测分析基础上可以重建空间参数,有效降低编码码率本专利技术提供的一种空间音频参数双向帧间预测编码装置,包含以下部分 空间音频参数提取模块,用于对输入的多声道音频信号的帧信号分子带提 取空间音频参数,并输出到空间音频参数预测模块;空间音频参数预测模块,用于使用之前帧的空间音频参数和之后帧的空间 音频参数拟合预测当前帧的空间音频参数,得到当前帧的空间音频参数的预测系数;再通过对比预测结果与空间音频参数提取模块所得实际的当前帧的空间 音频参数,得到对当前帧的空间音频参数的预测残差;并输出预测系数和预测 残差到空间音频参数编码模块;空间音频参数编码模块,用于将空间音频参数预测模块所得当前帧的空间 音频参数的预测系数和预测残差进行编码得到编码码流。而且,所述空间音频参数预测模块得到当前帧的空间音频参数的预测系数 和预测残差,具体实现过程如下,设由空间音频参数提取模块提取所得当前帧的《个子带的空间音频参数记为AS,…A,之前M帧的K个子带的空间音频参数记为i^,i^,…&,之后iV帧 的X个子带的空间音频参数记为^,^,…^ ,其中《》1, MW, A^0, M + W>0 ,当M〉0时w取l M,当A^O时"取1 W ;对当前帧的第i子带的空间音频参数e, BKK,用之前M帧的第/子带的 空间音频参数&和之后iV帧的第/子带的空间音频参数5 ,进行拟合,得到的拟合结果为当前帧的第/子带的空间音频拟合参数》=|> &+|> A,,其中 ,为前向预测系数,凡为后向预测系数;得到当前帧的第f子带的空间音频参数的预测系数C,M"h,…",凡,…AJ;根据当前帧的第子带的空间音频参数《和空间音频拟合参数》,计算当前 帧的第/子带的空间音频参数的预测残差《=f-《。本专利技术还提供了相应的空间音频参数双向帧间预测解码装置,包含以下部分空间音频参数解码模块,用于从编码码流中得到帧信号的空间音频参数的 预测系数和预测残差,并输入到空间音频参数重建模块;空间音频参数重建模块,用于使用之前帧的空间音频参数、之后帧的空间 音频参数及空间音频参数解码模块所得当前帧的预测系数和预测残差,重建得 到当前帧的空间音频参数。而且,所述空间音频参数重建模块重建得到当前帧的空间音频参数,具体 实现过程如下,空间音频参数重建模块从空间音频参数解码模块得到当前帧的空间音频参 数的预测系数和预测残差,设当前帧的第f子带的空间音频参数的预测系<:,={"|,,.. ,1,,...1}和预测残差《、之前M帧的K个子带的空间音频参数^,^,…&、之后A^帧的/^个子带的空间音频参数&,&,…&,M>0, iV20, M + 7V>0 ,当A/〉0时7W取1 M ,当7V〉0时n取1 7V,",,'"0^, 为前向预测系数,A,.,…A,为后向预测系数;重建得到当前帧第/子带的空间音频参数^ +《。本专利技术提供了一种空间音频参数双向帧间预测方案,包括编码端装置和解 码端装置。通过在编码端对空间音频参数的拟合分析,将预测系数和预测残差 放入编码码流;解码端就能用预测系数和预测残差来重建空间参数。可见本发 明充分利用了空间音频参数的时域相关性,可有效降低编码码率。 附图说明图l本专利技术的装置结构图2本专利技术的空间音频参数拟合预测原理图3本专利技术的空间音频参数重建原理图4本专利技术实施例的空间音频参数预测示意图。 具体实施例方式参见图1,本专利技术提供的空间音频参数双向帧间预测技术方案实现如下。 编码端(1)空间音频参数提取模块,用于对输入的多声道音频信号的帧信号分子带提 取空间音频参数,并输出到空间音频参数预测模块。用于从输入的多声道音频信号的当前帧提取得到多个子带的空间音频参 数。具体实施时,首先将当前帧信号由时域变换到频域,然后将所得的频域上的当前帧信号划分为K个子带并计算每个子带的空间音频参数,由此得出当前 帧的/^个子带的空间音频参数《,/>2,..力。该模块所提取的空间音频参数可以是ILD、 ITD、 IC等。划分子带的数目可 根据需要设定为一个或多个,建议采用现有音频技术中的Bark带划分规则分为 24个子带。(2)空间音频参数预测模块,用于使用之前帧的空间音频参数和之后帧的空间 音频参数拟合预测当前帧的空间音频参数,得到当前帧的空间音频参数的预测 系数;再通过对比拟合结果与空间音频参数提取模块所得实际的当前帧的空间 音频参数,得到对当前帧的空间音频参数的预测残差;并输出预测系数和预测 残差到空间音频参数编码模块。拟合无需当前帧的所有之前帧和之后帧,只需在具体实施时,根据重建精 确度和码率需要选择之前若干帧和之后若干帧即可。对当前帧处理完后,即从空间音频参数提取模块取多声道音频信号的下一帧信号作为当前帧,继续处理。 参见图2,使用前后若干帧空间音频参数对当前帧空间音频参数拟合后,可以缓 存记录当前帧空间音频参数用于其他帧拟合。参见图4,本专利技术实施例所取的空 间参数为ILD,按照时间顺序,通过前一帧ILD和后一帧ILD就可以拟合当前帧 ILD,得到预测残差。本专利技术提供了进一步技术方案以供参考实施所述空间音频本文档来自技高网
...

【技术保护点】
一种空间音频参数双向帧间预测编码装置,其特征在于:包含以下部分,空间音频参数提取模块,用于对输入的多声道音频信号的帧信号分子带提取空间音频参数,并输出到空间音频参数预测模块; 空间音频参数预测模块,用于使用之前帧的空间音频参数和之后帧 的空间音频参数拟合预测当前帧的空间音频参数,得到当前帧的空间音频参数的预测系数;再通过对比预测结果与空间音频参数提取模块所得实际的当前帧的空间音频参数,得到对当前帧的空间音频参数的预测残差;并输出预测系数和预测残差到空间音频参数编码模块;  空间音频参数编码模块,用于将空间音频参数预测模块所得当前帧的空间音频参数的预测系数和预测残差进行编码得到编码码流。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡瑞敏杭波马晔周成王晓晨
申请(专利权)人:武汉大学
类型:发明
国别省市:83[中国|武汉]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1