音频解码器、提供解码的音频信号的方法、和计算机程序技术

技术编号:38608575 阅读:12 留言:0更新日期:2023-08-26 23:38
公开了用于基于编码的音频信号表示来提供解码的音频信号表示的音频解码器,其被配置为根据配置信息调整解码参数,并使用当前配置信息解码一个或多个音频帧。音频解码器被配置为将与要解码的一个或多个帧相关联的配置结构中的配置信息与当前配置信息进行比较,并且如果配置结构中的配置信息、或者配置结构中的配置信息的相关部分与当前配置信息不同,则进行转换以使用配置结构中的配置信息作为新配置信息来进行解码。音频解码器被配置为当比较配置信息时考虑包括在配置结构中的流标识符信息,使得先前由音频解码器获取的流标识符和配置结构中的流标识符信息表示的流标识符之间的差异导致进行所述转换。还公开了对应的方法和计算机程序。法和计算机程序。法和计算机程序。

【技术实现步骤摘要】
音频解码器、提供解码的音频信号的方法、和计算机程序
[0001]本申请是申请日为2018年1月10日、国际申请号为PCT/EP2018/050575、中国申请号为“201880017357.7”、专利技术名称为“音频解码器、音频编码器、提供解码的音频信号的方法、提供编码的音频信号的方法、使用流标识符的音频流、音频流提供器和计算机程序”的申请的分案申请。


[0002]根据本专利技术的实施例涉及一种基于编码的音频信号表示来提供解码的音频信号表示的音频解码器。
[0003]根据本专利技术的其他实施例涉及一种提供编码的音频信号表示的音频编码器。
[0004]根据本专利技术的其他实施例涉及一种提供解码的音频信号表示的方法。
[0005]根据本专利技术的其他实施例涉及一种提供编码的音频信号表示的方法。
[0006]根据本专利技术的其他实施例涉及音频流。
[0007]根据本专利技术的其他实施例涉及音频流提供器。
[0008]根据本专利技术的其他实施例涉及执行这些方法之一的计算机程序。

技术介绍

[0009]在下文中,将描述本专利技术各个方面背后的问题和根据本专利技术的实施例的可能的使用场景。
[0010]存在在不同音频流之间或不同编码的音频帧序列之间转换的情况。例如,不同的音频帧序列可以包括不同的音频内容,在这些音频内容之间应该进行转换。
[0011]例如,当在自适应流式传输用例中采用MPEG

D USAC(ISO/IEC23003
>‑
3+Amd.1+Amd.2+Amd.3)时,可能发生所谓的自适应集合(例如,其可以使用户可以在其中切换的两个或更多个流形成组)内的两个流具有完全相同的配置结构(即使它们的比特率不同)的情况。例如,如果编码器仅选择使用针对两种比特率设置的完全相同的编码工具来操作编码器,则会发生这种情况。
[0012]例如,音频编码器可以使用相同的基本编码设置(其也被发信号通知给音频解码器),但是仍然可以提供音频值的不同表示。例如,当希望实现较低的比特率时,即使基本编码器设置或解码器设置保持不变,音频编码器也可以使用较粗略的频谱值量化,这导致较小的比特需求。
[0013]然而,这(例如,即使自适应集合内的两个流的比特率不同,这两个流具有完全相同的配置结构的情况的出现)也不是问题。
[0014]然而,已经发现,在自适应流式传输用例中,解码器应该知道随后接收的接入单元(或“帧”)是否源自相同的流或者是否发生了流改变。
[0015]已经发现,如果已经检测到流的改变,则音频解码器将在某些情况下运行指定的操作步骤序列,以确保以下步骤:
[0016]·
正确关闭一个解码器实例,并将临时内部存储的解码的信号部分馈送到解码器
输出——称为“刷新”的过程。
[0017]·
解码器将使用与改变的流相关联的配置信息重新实例化并重新配置自身。
[0018]·
解码器将“预滚动”嵌入式接入单元,这些接入单元搭载在立即播出帧(IPF)中。这种接入单元的预滚动使解码器处于完全初始化状态,使得解码第一帧的输出产生完全兼容的解码的音频信号。
[0019]·
可选地,例如,取决于相应的比特流信令元素,来自解码器刷新过程的音频输出和来自解码重新配置的解码器的第一接入单元的输出在很短的时间段内淡入淡出。
[0020]例如,可以运行所有上述步骤以实现获得从一个流的解码的音频到另一个流的解码的音频的“无缝”转换的唯一目标。“无缝”意味着流转换本身没有可听见的伪声和小故障。事实上,流转换可能在感知上是显而易见的,因为——例如——整体编码质量或音频带宽或音色的变化。然而,转换的实际点(时间点)本身不会引起听觉印象。换句话说,在转换点没有“点击”或“噪声突发”或类似的令人不安的声音。
[0021]已经发现,可以通过分析嵌入在立即播出帧中的配置结构并将其与当前解码的流的配置进行比较来获得是否已经发生流改变的信息。例如,当且仅当接收的配置与当前配置不同时,音频解码器才可以假设流的改变。
[0022]例如,如果解码器接收具有变化比特率的流的立即播出帧(IPF),则解码器检测音频预滚动扩展有效载荷的存在,提取配置结构并进行该新配置和当前配置之间的比较。有关更多详细信息,另请参见ISO/IEC 23003

3:2012/Amd.3,子条款“比特率自适应”。
[0023]然而,已经发现,如果当前配置结构和新配置结构两者相同,则解码器将无法识别出它正在从与之前不同的流中接收接入单元,因此将既不重新配置解码器且解码器也不会解码驻留在IPF的扩展有效载荷中的音频预滚动。
[0024]相反,解码器将尝试继续解码,就像其已从先前活跃流接收到继续的接入单元一样。这将(例如,在没有使用或评估streamI D的传统情况下)导致窗口边界和最后解码的帧的编码模式与新流的新帧不对应的可能情况,这继而又导致听觉伪音,如咔嗒声或噪音突发。这将挫败IPF的主要目的和自适应音频流传输理念,该理念基于流之间无缝转换的概念。
[0025]在下文中,将描述一些传统方法。
[0026]应该注意,对于统一语音和音频编码(USAC),没有已知的解决方案。
[0027]在MPEG

H3D音频(ISO/IEC 23008

3+所有修改)中,如果通过MPEG

H音频流(“MHAS”)打包流格式来发送音频数据,则可以解决该问题。MHAS包包含了可以在流之间不同的分组标签,因此可以用于区分配置。但是,没有针对MPEG

D USAC指定MHAS格式。
[0028]在MPEG

4HE

AAC(1SO/IEC 14496

3+所有修改)中,有一种解决方法需要编码器确保在潜在的转换点(所谓的流接入点(SAP))处所有流都具有相同的窗口形状和窗口序列以及针对所采用的信号处理工具的其他约束。这会对最终的音频质量产生不利影响。上面提到的I PF的设计完全是为了释放新编解码器的所有这些约束。
[0029]总之,需要一种允许在不同音频流之间进行切换的概念,并且该概念在开销量和易于实现之间提供了改进的折衷。

技术实现思路

[0030]根据本专利技术的实施例创建了一种音频解码器,用于根据编码的音频信号表示来提供解码的音频信号表示。音频解码器被配置为根据配置信息调整解码参数。音频解码器被配置为使用当前配置(例如,使用当前活动的配置信息)解码一个或多个音频帧。此外,音频解码器被配置为将与要解码的一个或多个帧相关联的配置结构中的配置信息与当前配置信息进行比较,并且如果与要解码的一个或多个帧相关联的配置结构中的配置信息、或者与要解码的一个或多个帧相关联的配置结构中的配置信息的相关部分(例如,直到并且包括流标识符的部分)与当前配置信息不同,则进行转换以使用与要解码的一个或多本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于基于编码的音频信号表示(110;210;312;412;550;600;700;800)来提供解码的音频信号表示(112;212)的音频解码器(100;200),其中,所述音频解码器被配置为根据配置信息(110a;222c;332;424;1010,1030)调整解码参数,其中所述音频解码器被配置为使用当前配置信息(140;240)解码一个或多个音频帧,以及其中所述音频解码器被配置为将与要解码的一个或多个帧(222)相关联的配置结构中的配置信息(110a;222c;332;424;1010,1030)与当前配置信息(140;240)进行比较,并且如果与要解码的所述一个或多个帧相关联的所述配置结构中的配置信息、或者与要解码的所述一个或多个帧相关联的所述配置结构中的配置信息的相关部分(1020a,1020b,1022a,1024a,1024b,1026a,1050a)与所述当前配置信息不同,则进行转换以使用与要解码的所述一个或多个帧相关联的所述配置结构中的配置信息作为新配置信息来进行解码;其中所述音频解码器被配置为在比较所述配置信息时考虑包括在所述配置结构中的流标识符信息(230;streamID,1050a,streamldentifier),使得先前由所述音频解码器获取的流标识符和与要解码的所述一个或多个帧相关联的所述配置结构中的流标识符信息表示的流标识符之间的差异导致进行所述转换,其中所述配置结构包括配置扩展结构,并且其中所述配置扩展结...

【专利技术属性】
技术研发人员:马克斯
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1