音频编码器和解码器制造技术

技术编号:21037390 阅读:33 留言:0更新日期:2019-05-04 06:47
本文涉及一种音频编码器和解码器。具体地,本文涉及一种特别适合于话音编码/解码的基于变换的音频编解码器系统。描述了被配置为将语音信号编码为比特流的基于变换的语音编码器(100、170)。编码器(100、170)包括被配置为接收块集合(132、332)的组帧单元(101);其中,块集合(132、332)包括变换系数的多个顺序块(131);其中,多个块(131)指示语音信号的采样;其中,变换系数的块(131)包括用于对应的多个频率区间(301)的多个变换系数。此外,编码器(100、170)包括包络估计单元(102),其被配置为基于变换系数的多个顺序块(131)来确定当前包络(133);其中,当前包络(133)指示关于对应的多个频率区间(301)的多个频谱能量值(303)。

【技术实现步骤摘要】
音频编码器和解码器本申请是申请日为2014年4月4日的、申请号为201480024367.5(国际申请号为PCT/EP2014/056851)以及专利技术名称为“音频编码器和解码器”的专利技术专利申请的分案申请。
本文件涉及一种音频编码和解码系统(被称为音频编解码器系统)。具体地,本文件涉及一种特别适合于话音编码/解码的基于变换的音频编解码器系统。
技术介绍
通用的感知音频编解码器通过按采样的覆盖几十毫秒(例如,20ms)的块大小使用诸如修正离散余弦变换(MDCT)的变换来实现相对高的编码增益。这样的基于变换的音频编解码器系统的例子是高级音频编码(AAC)或高效率(HE)-AAC。然而,当将这样的基于变换的音频编解码器系统用于话音信号时,话音信号的质量向着较低比特率恶化快于音乐信号,尤其是在干瘪的(非回响的)语音信号的情况下。因此,基于变换的音频编解码器系统本质上并不非常适合于话音信号的编码或者包括话音分量的音频信号的编码。换句话说,与对于话音信号实现的编码增益相比,基于变换的音频编解码器系统就对于音乐信号实现的编码增益而言表现出不对称性。该不对称性可以通过向基于变换的编码提供附件来本文档来自技高网...

【技术保护点】
1.一种使音频信号平坦的方法,包括:通过音频编码设备接收音频数据,该音频数据具有包括当前区间的多个修正离散余弦变换MDCT区间;至少基于在当前区间之前被索引的一个或更多个MDCT的能量,确定估计的变换系数,其中所述一个或更多个MDCT的数量的计数被设计为块偏移参数,所述确定包括计算当前区间的频谱能量包络以及在第一区间之前被索引的所述一个或更多个MDCT区间;基于估计的变换系数来使当前区间平坦,所述使当前区间平坦根据频谱能量包络来移除当前区间的频谱形状;以及向下游处理设备提供平坦的区间以用于附加处理。

【技术特征摘要】
2013.04.05 US 61/808,675;2013.09.09 US 61/875,5531.一种使音频信号平坦的方法,包括:通过音频编码设备接收音频数据,该音频数据具有包括当前区间的多个修正离散余弦变换MDCT区间;至少基于在当前区间之前被索引的一个或更多个MDCT的能量,确定估计的变换系数,其中所述一个或更多个MDCT的数量的计数被设计为块偏移参数,所述确定包括计算当前区间的频谱能量包络以及在第一区间之前被索引的所述一个或更多个MDCT区间;基于估计的变换系数来使当前区间平坦,所述使当前区间平坦根据频谱能量包络来移除当前区间的频谱形状;以及向下游处理设备提供平坦的区间以用于附加处理。2.根据权利要求1所述的方法,其中,所述使当前区间平坦包括合成噪声,所述合成是基于音频数据的音调来调整的。3.根据权利要求2所述的方法,其中,所述合成基于指示音频数据的音调的增益。4.一种音频处理设备,包括:一个或更多个处理器;以及存储介质,存储软件程序,该软件程序当被所述一个或更多个处理器执行时使所述一个或更多个处理器执行包括以下的操作:接收音频数据,该音频数据具有包括当前区间的多个修正离散余弦变换MDCT区间;至少基于在当前区间之前被索引的一个或更多个MDCT的能量,确定估计的变换系数,其中所述一个或更多个MDCT的数...

【专利技术属性】
技术研发人员:L·维勒莫斯J·克里萨P·何德林
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1