音频编码器制造技术

技术编号:23447857 阅读:90 留言:0更新日期:2020-02-28 21:32
本公开涉及音频编码器。该基于输入音频信息提供编码音频信息的音频编码器,包括:带宽扩展信息提供器,配置为使用可变时间分辨率提供带宽扩展信息,及侦测器,配置为侦测摩擦音或破擦音的起始段。音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的起始段的时间的之前的预定时间周期及针对侦测到摩擦音或破擦音的起始段的时间的之后的预定时间周期,以提高的时间分辨率提供带宽扩展信息。可选地或者此外,响应于侦测到摩擦音或破擦音的终止段,以提高的时间分辨率提供带宽扩展信息。音频编码器及方法使用对应的概念。

Audio encoder

【技术实现步骤摘要】
音频编码器本申请是国际申请号为PCT/EP2014/051635、申请日为2014年1月28日、进入中国国家阶段日期为2015年9月24日、专利技术名称为“在摩擦音或破擦音的起始段或终止段的时间的接近处使用提高的时间分辨率的音频编码器、音频解码器、系统、方法及计算机程序”的PCT申请的中国国家阶段申请的分案申请,该中国国家阶段申请的申请号为201480018073.1。
根据本专利技术的实施例是关于一种基于输入音频信息提供编码音频信息的音频编码器。根据本专利技术的其他实施例是关于一种基于编码音频信息提供解码音频信息的音频解码器。根据本专利技术的其他实施例是关于一种包括音频编码器及音频解码器的系统。根据本专利技术的其他实施例是关于一种基于输入音频信息提供编码音频信息的方法。根据本专利技术的其他实施例是关于一种基于编码音频信息提供解码音频信息的方法。根据本专利技术的其他实施例是关于一种执行所述方法中的一个的计算机程序。根据本专利技术的其他实施例是关于一种用于语音的音频带宽扩展中摩擦音或破擦音的起始段或终止段建模。
技术介绍
近年来,对音频信号,特定而言,对语音信号的数字储存及传输的需求愈来愈大。在某些类似例如行动通讯应用的情况下,要求获得相对低的比特率。然而,为了在比特率与音频质量(或语音质量)之间获得良好的平衡,存在方法来使用相对高的精度编码音频信号的低频部分(例如,最高达近似6kHz的频率部分),且依赖于带宽扩展重构音频内容的高频部分(例如,高于近似6kHz或7kHz的频率部分)。举例而言,带宽扩展可基于使用相对少的参数重构音频内容的高频部分,其中参数可例如以粗略方式描述频谱包络。带宽扩展的熟知实行方案为带宽复制(SBR),此实行方案已在MPEG(动画专家组)中进行标准化。举例而言,国际标准ISO/IEC14496-3:200X(E)第4子部分中第4.6.18及4.6.19章中描述了有关带宽复制的某些细节。此外,亦参阅了专利申请第US2011/0099018A1号,所述专利描述一种使用频谱倾斜受控式定帧计算带宽扩展数据的设备及方法。所述专利申请描述一种计算带宽扩展系统中音频信号的带宽扩展数据的设备,其中第一带宽用第一数目个位编码,且不同于第一带宽的第二带宽用第二数目个位编码,第二数目个位少于第一数目个位。设备具有可控带宽扩展参数计算器,所述可控带宽扩展参数计算器针对音频信号的第一序列帧以逐帧方式计算第二带宽的带宽扩展参数。每一帧具有可控开始时间瞬时。设备额外包括频谱倾斜侦测器,所述侦测器侦测音频信号的时间部分中的频谱倾斜且取决于频谱倾斜而信号传递音频信号的个别帧的开始时间瞬时。然而,已发现在带宽扩展的许多已知方法中,摩擦音或破擦音存在的情况下所获得的听觉效果实质上有所劣化。举例而言,已知带宽扩展技术可能引起前回声及后回声。此外,在使用已知带宽扩展技术时,摩擦音或破擦音可能会听起来过于尖锐。鉴于上述情形,需要创建允许改进的音频质量的带宽扩展概念。
技术实现思路
根据本专利技术的实施例创建一种基于输入音频信息提供编码音频信息的音频编码器。音频编码器包括配置为使用可变时间分辨率提供带宽扩展信息的带宽扩展信息提供器。音频编码器亦包括配置为侦测摩擦音或破擦音的起始段的侦测器。音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的起始段的时间的之前的预定时间周期及针对侦测到摩擦音或破擦音的起始段的时间的之后的预定时间周期,以提高的时间分辨率提供带宽扩展信息。根据本专利技术的此实施例基于如下发现,若针对侦测到摩擦音或破擦音的起始段的时间的整个环境,以高的时间分辨率提供带宽扩展信息,则可达成良好听觉质量。因此,以高的时间分辨率(至少关于带宽扩展信息)编码摩擦音或破擦音的整个起始段,所述整个起始段通常包括侦测到摩擦音或破擦音的起始段的时间的之前的特定时间扩展及实际侦测到摩擦音或破擦音的起始段的时间的之后的特定周期(时间扩展),从而有助于避免前回声且亦有助于避免不自然的听觉感觉。通常,无法非常精确地侦测到摩擦音或破擦音的起始段,因为摩擦音或破擦音的起始段的侦测常常基于临界交叉的侦测,而此交叉在摩擦音或破擦音的起始段的刚开始处显然并未出现。因此,(实际)侦测到摩擦音或破擦音的起始段的时间在时间上在摩擦音或破擦音的刚刚开始(或起始段)的后。因此,藉由确保至少针对(实际)侦测到摩擦音或破擦音的起始段的时间的前的预定时间周期,以提高的时间分辨率(与「正常的」时间分辨率相比)提供带宽扩展信息,可达成:亦可以良好分辨率重现摩擦音或破擦音的起始段刚刚开始处的细节,其中已发现,甚至在摩擦音或破擦音的起始段刚刚开始处的此类细节对于良好听觉感觉而言重要。因此,藉由至少针对侦测到摩擦音或破擦音的起始段的时间的前的预定时间周期,以提高的时间分辨率提供带宽扩展信息,不仅有助于避免前回声,亦使得能够重现摩擦音或破擦音的起始段的细节。类似地,藉由确保针对侦测到摩擦音或破擦音的起始段的时间的后的预定时间周期,以提高的时间分辨率提供带宽扩展信息,使得能够重现摩擦音或破擦音的起始段的细节,此类细节对于听力感觉而言重要。因此,本文所描述的概念使得能够以高的时间分辨率重现摩擦音或破擦音的整个起始段,此有助于避免听力感觉的劣化,而此劣化例如由摩擦音或破擦音的起始段刚刚开始处或自摩擦音或破擦音的起始段至稳定信号部分的过渡处(带宽扩展信息的)过于粗略的时间分辨率引起。在较佳实施例中,音频编码器配置为响应于侦测到摩擦音或破擦音的起始段,自用于提供带宽扩展信息的第一时间分辨率切换至用于提供带宽扩展信息的第二时间分辨率,其中第二时间分辨率高于第一时间分辨率。因此,执行用于提供带宽扩展信息的两个不同时间分辨率的间的切换,其中所述切换系由侦测到摩擦音或破擦音的起始段来控制。因此,创建一种简单控制方案,所述方案可容易地实施于音频编码器或音频解码器中。在较佳实施例中,带宽扩展信息提供器配置为提供带宽扩展信息,以使得带宽扩展信息与具有相等时间长度的时间上规则的时间间隔(可形成用于提供带宽扩展信息的基础但可细分的时间网格)相关联。带宽扩展信息提供器配置为当使用第一时间分辨率(例如,相对较低的时间分辨率)时,针对具有给定时间长度的时间间隔提供带宽扩展信息的单个集合。此外,带宽扩展信息提供器可配置为当使用第二时间分辨率(例如,相对较高的时间分辨率)时,针对具有给定时间长度的时间间隔提供与子时间间隔相关联的带宽扩展信息的多个集合。藉由将具有相等时间长度的时间上规则的时间间隔(例如,帧)用作用于提供带宽扩展信息的(基础)时间网格,音频编码器可得以容易地实施。举例而言,带宽扩展信息提供器仅需要在两个离散的时间分辨率的间切换,此切换可在无需过多工作量的情况下得以实施。举例而言,带宽扩展信息提供器可仅需实施以基于具有给定时间长度的时间间隔提供带宽扩展信息的单个集合,且基于具有给定时间长度的时间间隔的预定(及固定)数目个(具有相等长度)的子间隔提供带宽扩展信息的多个集合。因此,以下可例本文档来自技高网
...

【技术保护点】
1.一种基于输入音频信息(112)提供编码音频信息(112)的音频编码器(100),所述音频编码器包括:/n带宽扩展信息提供器(130),配置为使用可变时间分辨率提供带宽扩展信息(132);/n侦测器(120),配置为侦测摩擦音或破擦音的起始段;/n其中,所述音频编码器配置为调整所述带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的起始段的时间(t

【技术特征摘要】
20130129 US 61/758,0781.一种基于输入音频信息(112)提供编码音频信息(112)的音频编码器(100),所述音频编码器包括:
带宽扩展信息提供器(130),配置为使用可变时间分辨率提供带宽扩展信息(132);
侦测器(120),配置为侦测摩擦音或破擦音的起始段;
其中,所述音频编码器配置为调整所述带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的起始段的时间(tf)的之前的预定时间周期(630a)及针对侦测到所述摩擦音或破擦音的所述起始段的所述时间的之后的预定时间周期(630c),以提高的时间分辨率提供带宽扩展信息。


2.根据权利要求1所述的音频编码器(100),其中,所述音频编码器配置为响应于所述侦测到摩擦音或破擦音的所述起始段,从用于所述提供所述带宽扩展信息的第一时间分辨率切换至用于所述提供所述带宽扩展信息的第二时间分辨率,
其中,所述第二时间分辨率高于所述第一时间分辨率。


3.根据权利要求1所述的音频编码器(100),其中,所述带宽扩展信息提供器配置为提供所述带宽扩展信息,以使得所述带宽扩展信息与具有相等时间长度的时间上规则的时间间隔(620a,620b,620c,620d,620e,620f;720a-720f)相关联,
其中,所述带宽扩展信息提供器配置为如果使用第一时间分辨率,则针对具有给定时间长度的时间间隔(620a,620b,620c,620d,620f;720a,720b,720c,720f)提供带宽扩展信息的单个集合,以及
其中,所述带宽扩展信息提供器配置为如果使用第二时间分辨率,则针对具有所述给定时间长度的时间间隔(620e;720d,720e)提供与子时间间隔(630a,630b,630c,630d)相关联的带宽扩展信息的多个集合。


4.根据权利要求3所述的音频编码器(100),其中,所述音频编码器配置为调整所述带宽扩展信息提供器所使用的时间分辨率,以使得与带宽扩展信息的一个集合相关联的至少一个子时间间隔(630a;730d)紧接在另一子时间间隔(630b;730e)的前面,所述另一子时间间隔与带宽扩展信息的另一集合相关联且在所述另一子时间间隔期间(630b;730e)侦测到摩擦音或破擦音的起始段,
以使得在侦测到摩擦音或破擦音的起始段的所述子时间间隔(630b;730e)的之前的至少一个子时间间隔(630a;730d)中使用所述提高的时间分辨率。


5.根据权利要求3所述的音频编码器(100),其中,所述音频编码器配置为如果针对具有给定时间长度的给定时间间隔(620e;720d,720e)...

【专利技术属性】
技术研发人员:萨沙·迪施克里斯蒂安·赫尔姆里希马库斯·穆赖特鲁斯马库斯·施内尔阿瑟·特里特哈特
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1