音频信号编码器、音频信号译码器、用以提供音频内容的编码表示型态的方法、用以提供音频内容的译码表示型态的方法及用于低延迟应用的计算机程序技术

技术编号:8165775 阅读:181 留言:0更新日期:2013-01-08 12:30
一种音频信号编码器(100)包含一变换域路径(12),其被构造为基于将以变换域模式编码的音频内容部分的时域表示型态(122)而获得一频谱系数集合(124)和噪声成形信息(126)。该变换域路径包含一时域至频域转换器(130),其被构造为对该音频内容的时域表示型态开窗以获得音频内容的开窗表示型态,并施加时域至频域转换以从该音频内容的开窗时域表示型态而导算出一频谱系数集合。该音频信号译码器包含一CELP路径(140),其被构造为基于将以CELP模式编码的音频内容部分获得码激励信息(144)和线性预测域参数信息(146)。时域至频域转换器(136)被构造为若该音频内容的目前部分被将以变换域模式编码的音频内容的随后部分所跟随,且若该音频内容的目前部分被将以CELP模式编码的音频内容的随后部分所跟随,则施加一预定非对称分析窗用于对将以变换域模式编码且跟随在将以变换域模式编码的音频内容部分后方的音频内容的目前部分进行开窗。若该音频内容的目前部分被将以CELP模式编码的音频内容的随后部分所跟随,则该音频信号编码器被构造为选择性地提供频迭抵消信息(164)。

【技术实现步骤摘要】
【国外来华专利技术】
根据本专利技术的实施例涉及一种用以基于音频内容的输入表示型态而提供该音频内容的编码表示型态的音频信号编码器。根据本专利技术的实施例涉及一种用以基于音频内容的编码表示型态而提供该音频内容的译码表示型态的音频信号译码器。根据本专利技术的实施例涉及一种用以基于音频内容的输入表示型态而提供该音频内容的编码表示型态的方法。 根据本专利技术的实施例涉及一种用以基于音频内容的编码表示型态而提供该音频内容的译码表示型态的方法。根据本专利技术的实施例涉及一种用以执行这些方法的计算机程序。根据本专利技术的实施例涉及一种用于带有低延迟的统一语音和音频编码的新颖编码方案。
技术介绍
后文中将简短解释本专利技术的背景,方便协助了解本专利技术及其优点。过去十年间,大量努力致力于以良好位率效率而数字式存储与分配音频内容的可能性。以此方式的一项重大成就为国际标准IS0/IEC 14496-3的定义。该标准的第三部分涉及音频内容的编码及译码,而第三部分的第四次部分涉及一般音频编码。IS0/IEC 14496第三部分、第四次部分定义一般音频内容的编码及译码构想。此外,已经提示进一步改进来改善质量和/或降低所要求的位率。此外,已经发展音频编码器及音频译码器,它们特别适合用于编码及译码语音信号。这些语音最佳化音频编码器例如在第三代协作项目计划的技术规格“3GPP TS26. 090”、“3GPP TS 26. 190”、及 “3GPP TS 26. 290” 中得到描述。已经发现有多项应用,其中,期望低的编码及译码延迟。举例言之,实时多媒体应用期望低度延迟,原因在于明显延迟将导致此项应用给使用人留下不愉悦的印象。然而,也发现,质量与位率间的良好折衷偶尔要求取决于音频内容而在不同编码模式间作切换。已经发现音频内容的变异导致期望在编码模式间作改变,例如在变换编码激励线性预测域模式与码激励线性预测域模式(例如代数码激励线性预测域模式)间改变,或在频域模式与码激励线性预测域模式间改变。原因在于实际上有些音频内容(或接续音频内容的某些部分)可在这些模式中的一者中以较高编码效率编码,而其它音频内容(或相同连续音频内容的某些部分)可在这些模式中的一不同者以较佳编码效率编码。有鉴于此种情况,发现期望在不同模式间切换而无需大量位率窗外间接管理数据量用于切换,且未显着地有损音频质量(例如呈现切换「喀嚓(click)」形式)。此外,发现不同模式间的切换须与具有低编码及译码延迟的目的为可兼容性。有鉴于此种情况,本专利技术的目的形成一种用于多模式音频编码的构想,当在不同编码模式间切换时,其获致位率效率、音频质量与延迟间的良好折衷。
技术实现思路
专利技术概要根据本专利技术的实施例形成一种用以基于一音频内容的输入表示型态提供该音频内容的编码表示型态的音频信号编码器。该音频信号编码器包含一变换域路径,其被构造为基于将以变换域模式编码的该音频内容部分的时域表示型态,而获得一频谱系数集合及噪声成形信息(例如定标因子信息或线性预测域参数信息),使得频谱系数描述该音频内容的一噪声成形(例如经定标因子处理或经线性预测域噪声成形)版本的频谱。该变换域路径包含一时域至频域转换器,其被构造为开窗该音频内容的一时域表示型态或其前处理版本,而获得该音频内容的开窗表示型态,且施加时域至频域转换以从该音频内容的开窗 时域表示型态导算出一频谱系数集合。该音频信号编码器也包含一码激励线性预测域路径(被简单标示为CELP路径),其被构造为基于将以码激励线性预测域模式(也简短标示为CELP模式)编码的音频内容部分(例如代数码激励线性预测域模式),获得一码激励信息(例如代数码激励信息)及一线性预测域参数信息。该时域至频域转换器被构造为若音频内容的目前部分被该将以变换域模式编码的音频内容的一随后部分所跟随,且若该音频内容的目前部分被将以CELP模式编码的音频内容的一随后部分所跟随,则施加一预定非对称分析窗用于对将以变换域模式编码且跟随在将以变换域模式编码的音频内容部分后方的的音频内容的目前部分进行开窗。该音频信号编码器被构造为若该音频内容的目前部分(其以变换域模式编码)被将以CELP模式编码的该音频内容的随后部分所跟随,则选择性地提供频迭抵消信息(aliasing cancellation information)。根据本专利技术的实施例是基于发现通过在变换域模式与CELP模式间切换,可获得编码效率(例如以平均位率表示)、音频质量与编码延迟间的良好折衷,其中,将以变换域模式编码的音频内容部分的开窗与其中编码该音频内容的随后部分的模式不相干地,及其中通过选择性地提供频迭抵消信息而使得频迭假影(aliasing artifacts)的减少或抵消变得可能,该频迭假影由使用开窗而其并未特别调适变迁朝向以CELP模式编码的该音频内容部分引起。如此,通过选择性提供频迭抵消信息,可使用一窗用于以变换域模式编码的音频内容部分(例如帧或次帧)的开窗,这些窗包含与这些音频内容的随后部分的时间重叠(或甚至频迭抵消重叠)。如此允许一序列以变换域模式编码的音频内容的随后部分的良好编码效率,原因在于这些窗的使用导致音频内容的随后部分间的时间重叠,形成可能具有特别有效的重叠及相加的译码器端。此外,若音频内容的目前部分被该将以变换域模式编码的音频内容的一随后部分所跟随,且若该音频内容的目前部分被将以CELP模式编码的音频内容的一随后部分所跟随,则通过使用相同窗对将以变换域模式编码且接在以变换域模式编码的该音频内容部分后方的音频内容部分进行开窗,可将延迟维持在低延迟。换言之,知道其中编码音频内容的随后部分的模式并非是选择一窗用于音频内容的目前部分的开窗所需要的。如此,编码延迟维持在小值,原因在于用于音频内容的随后部分编码的编码模模式已知之前,可执行音频内容的目前部分的开窗。尽管如此,通过使用开窗而导入的假影,可在译码器端使用频迭抵消信息而被抵消,该窗并非完美适用于从以变换域模式编码的音频内容部分变迁至以CELP模式编码的该音频内容部分。如此,获得良好的平均编码效率,即便从以变换域模式编码的音频内容部分变迁至以CELP模式编码的该音频内容部分的变迁要求若干额外频迭抵消信息也如此。通过提供频迭抵消信息,音频质量维持在低质量;而通过做出与其中音频内容的随后部分的编码模式不相干的窗的选择,延迟可维持在较小值。要言之,如前文讨论的音频编码器组合良好位率效率与低编码延迟,而仍然允许良好的音频质量。在较佳实施例中,该时域至频域转换器被构造为若该音频内容的目前部分被将以变换域模式编码的音频内容的一随后部分所跟随,且若该音频内容的目前部分被将以CELP模式编码的音频内容的一随后部分所跟随,则施加相同窗用于将以变换域模式编码且跟随在将以变换域模式编码的音频内容部分后方的音频内容的目前部分进行开窗。在较佳实施例中,该预定非对称窗包含一左半窗及一右半窗,其中,该左半窗包含 一左侧变迁斜坡,其中,所有窗值自零单调地增加至一窗中心值(位在该窗中心的一值);及一过冲部分,其中,所有窗值大于该窗中心值,及其中,该窗包含一最大值。该右半窗包含一右侧变迁斜坡,其中,所有窗值自该窗中心值单调地减至零,及一右侧零部分。通过使用此种非对称窗,编码延迟维持特小。而且,经由强调使用过冲部的左半窗,在变迁朝向以CELP模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:拉尔夫·盖尔马库斯·施内尔耶雷米·勒科米特康斯坦丁·施密特纪尧姆·福奇斯尼古劳斯·雷特尔巴赫
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利