【技术实现步骤摘要】
用于缩减解码的方法和音频解码器
[0001]本申请是申请日为2016年6月10日的PCT国际申请PCT/EP2016/063371进入中国国家阶段的题为“缩减编码”的专利技术专利申请No.201680047160.9的分案申请。
[0002]本申请涉及缩减(downscaled)解码构思。
技术介绍
[0003]MPEG
‑
4增强型低延迟AAC(AAC
‑
ELD)通常以高达48kHz的采样率操作,导致15ms的算法延迟。对于某些应用,例如音频的唇音同步(lip
‑
sync)传输,期望更低的延迟。AAC
‑
ELD已经通过以更高的采样率(例如,96kHz)操作来提供这样的选择,从而提供具有更低延迟(例如,7.5毫秒)的操作模式。但是,这种操作模式由于采样率高而带来不必要的高复杂度。
[0004]该问题的解决方案是应用滤波器组的缩减版本,并且从而以较低的采样率(例如,48kHz,而不是96kHz)来渲染音频信号。缩减操作已经是AAC
‑
ELD的一部分,因为它是从作为AAC
‑
ELD基础的MPEG
‑
4AAC
‑
LD编解码器继承而来的。
[0005]但是,仍然存在的问题是如何找到特定滤波器组的缩减版本。也就是说,唯一的不确定因素是在支持对AAC
‑
ELD解码器的缩减操作模式的清楚的一致性测试的同时推导窗系数的方式。
[0006]在下文 ...
【技术保护点】
【技术特征摘要】
1.一种音频解码器(10),被配置为以第一采样率从数据流(24)解码音频信号(22),所述音频信号(22)是以第二采样率变换编码到所述数据流中的,所述第一采样率是所述第二采样率的1/F,所述音频解码器(10)包括:接收器(12),被配置为接收所述音频信号的每帧的N个频谱系数(28),其中帧的长度为N;抓取器(14),被配置为针对每个帧从所述N个频谱系数(28)中抓取长度为N/F的低频分量;频谱
‑
时间调制器(16),被配置为针对每个帧(36),使所述低频分量经过逆变换以获得长度为(E+2)
·
N/F的时间部分,其中所述逆变换具有在时间上在相应帧以及E+1个先前帧上延伸的长度为(E+2)
·
N/F的调制函数;加窗器(18),被配置为针对每个帧(36)使用长度为(E+2)
·
N/F的合成窗口为所述时间部分加窗,所述合成窗口包括在其前端的长度为1/4
·
N/F的零部分,并且在所述合成窗口的一时间间隔内具有峰值,所述时间间隔在所述零部分之后并且具有长度7/4
·
N/F,使得所述加窗器获得长度为(E+2)
·
N/F的经加窗的时间部分;以及时域混叠消除器(20),被配置为使所述帧的经加窗的时间部分经过重叠相加处理,使得当前帧的经加窗的时间部分的长度为(E+1)/(E+2)的尾端分量与前一帧的经加窗的时间部分的长度为(E+1)/(E+2)的前端重叠,其中所述逆变换是逆MDCT或逆MDST,以及其中所述合成窗口是对长度为(E+2)
·
N的参考合成窗口按照因子F进行下采样且按照长度为1/4
·
N的分段进行分段内插获得的下采样版本,其中,所述音频解码器(10)被配置为以如下方式执行所述内插:所述合成窗口的系数中的大部分取决于所述参考合成窗口的不止两个系数,并且所述合成窗口的每个系数不取决于所述参考合成窗口的属于与该系数所在的分段不同的分段的系数。2.根据权利要求1所述的音频解码器(10),其中所述逆变换是逆MDCT。3.根据权利要求1所述的音频解码器(10),其中,所述合成窗口的大小的80%以上被包括在所述零部分之后并且具有长度7/4
·
N/F的所述时间间隔内。4.根据权利要求1所述的音频解码器(10),其中,所述音频解码器(10)被配置为执行所述内插或者从存储器导出所述合成窗口。5.根据权利要求1所述的音频解码器(10),其中,所述音频解码器(10)被配置为支持F的不同值。6.根据权利要求1所述的音频解码器(10),其中F在1.5和10之间,且包括1.5和10。7.根据权利要求1所述的音频解码器(10),其中,所述参考合成窗口是单峰的。8.根据权利要求1所述的音频解码器(10),其中,所述音频解码器(10)被配置为以如下方式执行所述内插:所述合成窗口的被多于来自分段边界的两个系数所分隔的每个系数取决于所述参考合成窗口的系数中的两个。9.根据权利要求1所述的音频解码器(1...
【专利技术属性】
技术研发人员:马库斯,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。