用于对音频信号进行编码的音频编码器以及方法技术

技术编号:39811395 阅读:9 留言:0更新日期:2023-12-22 19:28
一种用于对具有下频带和上频带的音频信号进行编码的音频编码器,包括:检测器

【技术实现步骤摘要】
用于对音频信号进行编码的音频编码器以及方法
[0001]本申请是申请日为
2017
年4月6日

申请号为
201780035964.1
的中国专利技术专利申请“用于对音频信号进行编码的音频编码器以及方法”的分案申请



[0002]本专利技术涉及音频编码,并且优选地涉及用于控制
EVS
编译码器中的基于
MDCT

TCX
的频谱系数的量化的方法

装置或计算机程序


技术介绍

[0003]EVS
编译码器的参考文档为:
3GPP TS24.445V13.1.0(2016

03)
,第三代合作伙伴计划;技术规范小组服务及系统方面;用于增强型语音服务
(EVS)
的编译码器;详细算法描述
(

13

)。
[0004]然而,本专利技术额外地适用于例如由除第
13
版之外的其他版本限定的其他
EVS
版本,并且附加地,本专利技术额外地适用于不同于
EVS
然而依赖于例如在权利要求中所限定的检测器

整形器以及量化器和编码器级的所有其他音频编码器

[0005]额外地,应注意,不仅由独立权利要求限定而且由从属权利要求限定的所有实施例可以彼此分离地使用,或者如由权利要求的相互从属性所概述的或如随后在优选示例下所论述的那样一起使用

[0006]如
3GPP
中所指定的,
EVS
编译码器
[1]是用于窄带
(NB)、
宽带
(WB)、
超宽带
(SWB)
或全频带
(FB)
语音及音频内容的现代混合型编译码器,其可以基于信号分类而在若干编码方法之间切换

[0007]图1示出了
EVS
中的公共处理和不同编码方案

具体地,图1中的编码器的公共处理部分包括信号重新采样块
101
和信号分析块
102。
音频输入信号在音频信号输入
103
处被输入到公共处理部分中,并且具体地,被输入到信号重新采样块
101


信号重新采样块
101
额外地具有用于接收命令行参数的命令行输入

如图1中可见,公共处理级的输出被输入到不同的元件中

具体地,图1包括基于线性预测的编码块
(
基于
LP
的编码
)110、
频域编码块
120
,以及非活动信号编码
/CNG

130。

110、120、130
连接至比特流多路复用器
140。
此外,提供切换器
150
用于根据分类器决策来将公共处理级的输出切换到基于
LP
的编码块
110、
频域编码块
120
或非活动信号编码
/CNG(
舒适噪声生成
)

130。
此外,比特流多路复用器
140
接收分类器信息,即,是否使用块
110、120、130
中的任一者来对在块
103
处输入并且由公共处理部分处理的输入信号的某一当前部分进行编码

[0008]‑
诸如
CELP
编码之类的基于
LP(
基于线性预测
)
的编码主要用于语音内容或语音主导内容以及具有高时间波动的一般音频内容

[0009]‑
频域编码用于所有其他一般音频内容,诸如音乐或背景噪声

[0010]为了为低比特率和中等比特率提供最大质量,基于公共处理模块中的信号分析来执行基于
LP
的编码与频域编码之间的频繁切换

为了节省复杂度,编译码器被优化以在后续模块中还重新使用信号分析级的元件

例如:信号分析模块以
LP
分析级为特征

所产生的
LP
滤波器系数
(LPC)
及残差信号首先被用于若干信号分析步骤,诸如话音活动检测器
(VAD)
或语音
/
音乐分类器

其次,
LPC
也是基于
LP
的编码方案和频域编码方案的基本部分

为了节省复杂度,以
CELP
编码器的内部采样率
(SR
CELP
)
来执行
LP
分析

[0011]CELP
编码器在
12.8kHz

16kHz
内部采样率
(SR
CELP
)
下操作,并且因此可以直接表示高达
6.4kHz

8kHz
音频带宽的信号

对于在
WB、SWB

FB
下超出该带宽的音频内容,用带宽扩展机制对高于
CELP
的频率表示的音频内容进行编码

[0012]基于
MDCT

TCX
是频域编码的子模式

如对于基于
LP
的编码方法,基于
LP
滤波器来执行
TCX
中的噪声整形

通过将从经加权经量化的
LP
滤波器系数中计算的增益因子应用于
MDCT
频谱
(
译码器侧
)
来在
MDCT
域中执行该
LPC
整形

在编码器侧,在速率循环
(rate loop)
之前应用逆增益因子

这因此被称作
LPC
整形增益的应用
。TCX
在输入采样率
(SR
inp
)
上进行操作

这被用来直接在
MDCT
域中对完整的频谱进行编码,而无需额外的带宽扩展

输入采样率
SR
inp
(
按其执行
MDCT
变换
)
可以高于
CELP
采样率
SR
CELP
(
针对其计算...

【技术保护点】

【技术特征摘要】
1.
一种用于对具有下频带和上频带的音频信号进行编码的音频编码器,包括:检测器
(802)
,用于检测所述音频信号的所述下频带中的显著信号分量和所述上频带中的尖峰频谱区域;整形器
(804)
,用于使用所述下频带的整形信息来对所述下频带进行整形,并且用于使用所述下频带的整形信息的至少一部分来对所述上频带进行整形,其中,所述整形器
(804)
被配置为当检测到所述下频带中的所述显著信号分量时,额外地衰减所述上频带中的检测到的尖峰频谱区域中的频谱值;以及量化器和编码器级
(806)
,用于对经整形的下频带和经整形的上频带进行量化,并且用于对来自经整形的下频带和经整形的上频带的经量化的频谱值进行熵编码
。2.
根据权利要求
l
所述的音频编码器,还包括:线性预测分析器
(808)
,用于通过分析所述音频信号的时间帧中的音频样本的块来导出所述时间帧的线性预测系数,所述音频样本被频带限制到所述下频带,其中,所述整形器
(804)
被配置为使用所述线性预测系数作为所述整形信息来对所述下频带进行整形,以及其中,所述整形器
(804)
被配置为使用从被频带限制到所述下频带的音频样本的块中导出的所述线性预测系数的至少一部分来对所述音频信号的所述时间帧中的所述上频带进行整形
。3.
根据权利要求1或2所述的音频编码器,其中,所述整形器
(804)
被配置为使用从所述音频信号的所述下频带中导出的线性预测系数来计算所述下频带的多个子频带的多个整形因子,其中,所述整形器
(804)
被配置为使用针对所述下频带的子频带所计算的整形因子来在所述下频带中对对应子频带中的频谱系数进行加权,并且所述整形器
(804)
被配置为使用针对所述下频带的子频带中的一个所计算的整形因子来对所述上频带中的频谱系数进行加权
。4.
根据权利要求1所述的音频编码器,其中,所述检测器
(802)
被配置为当一组条件中的至少一个为真时确定所述上频带中的尖峰频谱区域,所述一组条件至少包括以下项:尖峰距离条件
(1104)
以及尖峰振幅条件
(1106)。5.
根据权利要求1所述的音频编码器,其中,所述整形器
(804)
被配置为基于所述上频带中的最大频谱振幅或基于所述下频带中的最大频谱振幅来衰减检测到的尖峰频谱区域中的至少一个频谱值
。6.
根据权利要求1所述的音频编码器,其中,所述整形器
(804)
被配置为基于以下项来对检测到的尖峰频谱区域中的频谱值进行整形:使用所述下频带的整形信息的所述至少一部分的第一加权操作
(1702、804a)
,以及使用衰减信息的第二后续加权操作
(1704、804b)
;或者使用所述衰减信息的第一加权操作,以及使用所述下频带的整形信息的所述至少一部分的第二后续加权信息,或者使用从所述衰减信息以及从所述下频带的整形信息的所述至少一部分导出的组合加
权信息的单个加权操作
。7.
根据权利要求6所述的音频编码器,其中,所述下频带的整形信息是整形因子的集合,每个整形因子与所述下频带的一个子频带相关联,其中,在所述较高频带的整形操作中所使用的所述下频带的整形信息的所述至少一部分是与所述下频带的特定子频带相关联的整形因子,所述特定子频带具有所述下频带中的所有子频带的最高中心频率,或者,其中,所述衰减信息是应用于以下项的衰减因子:检测到的频谱区域中的至少一个频谱值,或检测到的频谱区域中的所有频谱值,或已由所述检测器
(802)
针对所述音频信号的时间帧检测到所述尖峰频谱区域的所述上频带中的所有频谱值,或者其中,所述整形器
(804)
被配置为:当所述检测器
(802)
并未检测到...

【专利技术属性】
技术研发人员:马库斯
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1