提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码制造技术

技术编号:8656494 阅读:179 留言:0更新日期:2013-05-02 00:14
音频编码器包括窗口函数控制器(504)、加窗器(502)、具有最终质量检查功能的时间扭曲器(506)、时间/频率转换器(508)、TNS级(510)或量化器编码器(512),由时间扭曲分析器(516)或信号分类器(520)获得的信号分析结果来控制所述窗口函数控制器(504)、所述时间扭曲器(506)、所述TNS级(510)或附加的噪声填充分析器(524)。此外,解码器使用取决于音频信号的谐波或语音特性的经操纵的噪声填充估计来应用噪声填充操作。

【技术实现步骤摘要】

本专利技术涉及音频编码和解码,并且具体地针对具有谐波或语音内容的、可受到时间扭曲处理的音频信号的编码/解码。
技术介绍
在下文中,将给出对时间扭曲音频编码的领域的简要说明,该编码的概念可结合本专利技术的一些实施例一起应用。近年来,技术上的发展可将音频信号变换为频域表示,并且例如考虑到感知屏蔽阈值,可以对该频域表示进行有效地编码。如果发送编码频谱系数组的块长度很长,且如果仅相当小数目的频谱系数远在该全局屏蔽阈值之上,同时很大数目的频谱系数在该全局屏蔽阈值附近或之下并可能因而被忽略(或以最小码长进行编码)时,该音频信号编码的概念特别有效。例如,基于余弦或基于正弦的调制的重叠变换通常由于它们的能量压缩性质而用于源编码的应用。即,对于具有恒定基本频率(音调)的谐音而言,它们将信号能量浓缩于小数目的频谱分量(子频带)中,这导致了有效的信号表示。大体而言,应当将信号的(基本)音调理解为可与该信号频谱相区别的最低主频率。在普通语音模型中,该音调是由人类喉咙调制的激励信号的频率。如果仅一个单一基本频率存在,该频谱将极其简单,仅包括该基本频率及泛音。可以高效地对这种频谱编码。然而,对于具有变化音调的本文档来自技高网...

【技术保护点】
一种用于基于音频信号的表示(110;234e;234k)来提供时间扭曲激活信号(112;232;234p)的时间扭曲激活信号提供器(100;230;234),所述时间扭曲激活信号提供器包括:能量压缩信息提供器(120;234f;234l;325;370),被配置为提供能量压缩信息(122;234m;234n;326;374),所述能量压缩信息描述所述音频信号的时间扭曲变换频谱表示(222)的能量压缩;以及比较器(130;234o),被配置为将所述能量压缩信息(122;234m;234n;326;374)与参考值相比较,以及被配置为取决于比较结果提供时间扭曲激活信号(112;232;234p)。

【技术特征摘要】
2008.07.11 US 61/079,8731.一种用于基于音频信号的表不(110 ;234e ;234k)来提供时间扭曲激活信号(112 ;232 ;234p)的时间扭曲激活信号提供器(100 ;230 ;234),所述时间扭曲激活信号提供器包括:能量压缩信息提供器(120 ;234f ;2341 ;325 ;370),被配置为提供能量压缩信息(122 ;234m ;234n ;326 ;374),所述能量压缩信息描述所述音频信号的时间扭曲变换频谱表示(222)的能量压缩;以及比较器(130 ;234o),被配置为将所述能量压缩信息(122 ;234m ;234n ;326 ;374)与参考值相比较,以及被配置为取决于比较结果提供时间扭曲激活信号(112 ;232 ;234p)。2.根据权利要求1所述的时间扭曲激活信号提供器(100;230;234),其中,所述能量压缩信息提供器(120 ;234f ;2341)被配置为提供作为所述能量压缩信息(122 ;234m ;234η)的频谱平坦度度量,所述频谱平坦度度量描述所述音频信号的时间扭曲变换频谱表示(234e ;234k)。3.根据权利要求2所述的时间扭曲激活信号提供器(100;230 ;234),其中,所述能量压缩信息提供器(120 ;234f ;2341)被配置为计算所述音频信号的时间扭曲变换功率频谱(234e ;234k)的几何平均与所述音频信号的时间扭曲变换功率频谱(234e ;234k)的算术平均的商,以获得所述频谱平坦度度量。4.根据权利要求1所述的时间扭曲激活信号提供器(100;230 ;234),其中,所述能量压缩信息提供器(120 ;234f ;2341)被配置为:与所述时间扭曲变换频谱表示(234e ;234k)的较低频率部分相比时,强调所述时间扭曲变换频谱表示(234e ;234k)的较高频率部分,以获得所述能量压缩信息(122 ;234m ;234n)。5.根据权利要求1所述的时间扭曲激活信号提供器(100;230 ;234),其中,所述能量压缩信息提供器(120 ;234m;234η)被配置为获得频谱平坦度的多个逐频带度量,以及被配置为计算所述频谱平坦 度的多个逐频带度量的平均值,以获得所述能量压缩信息(122,234m ;234n)。6.根据权利要求1所述的时间扭曲激活信号提供器(100;230 ;234),其中,所述能量压缩信息提供器(120 ;234f ;2341 ;325)被配置为提供作为所述能量压缩信息(122 ;234m ;234η)的感知熵(pe)度量,所述感知熵(pe)度量描述所述音频信号的时间扭曲变换频谱表示(234e ;234k)。7.根据权利要求6所述的时间扭曲激活信号提供器(100;230 ;234 ;235),其中,所述能量压缩信息提供器(120 ;234f ;2341 ;325)被配置为基于扩缩因子频带的波形因子信息(ffac(n)),计算所述音频信号的时间扭曲变换频谱表示(234e;234k)的一个或多个扩缩因子频带的非零线的估计数目(nl),以及被配置为将非零线的所述估计数目(nl)与在考察的扩缩因子频带的能量度量相乘,来计算所考察的所述扩缩因子频带的感知熵(326)度量。8.根据权利要求1所述的时间扭曲激活信号提供器(100;230;234),其中,所述能量压缩信息提供器(120 ;234f ;2341 ;370)被配置为提供作为所述能量压缩信息的自相关度量(374),所述自相关度量(374)描述所述音频信号的时间扭曲时域表示(234e ;234k)的自相关。9.根据权利要求...

【专利技术属性】
技术研发人员:斯特凡·拜尔萨沙·迪施拉尔夫·盖格尔纪尧姆·福克斯马克斯·诺伊恩多夫杰拉尔德·舒勒贝恩德·埃德勒
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1