用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法技术

技术编号：12576159 阅读：74 留言：0更新日期：2015-12-23 16:14

提供一种用于从包括多个时域降混样本的降混信号产生包括一个或多个音频输出声道的音频输出信号的解码器。降混信号编码两个或更多个音频对象信号。解码器包括用于确定多个分析窗的窗序列产生器(134)，其中分析窗中的每个包括降混信号的多个时域降混样本。多个分析窗中的每个分析窗具有指示分析窗的时域降混样本的数目的窗长度。窗序列产生器(134)用于确定多个分析窗，以便分析窗中的每个的窗长度取决于两个或更多个音频对象信号中的至少一个的信号属性。此外，解码器包括t/f分析模块(135)，用于根据多个分析窗中的每个分析窗的窗长度将分析窗的多个时域降混样本从时域变换至时频域，以获得变换后的降混。此外，解码器包括解混单元(136)，用于基于关于两个或更多个音频对象信号的参数边信息对变换后的降混进行解混，以获得音频输出信号。此外，提供一种编码器。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号编码、音频信号解码及音频信号处理，特别地，涉及一种用于空间音频对象编码（SAOC)中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法。
技术介绍
在现代数字音频系统中，允许在接收器侧上对所传输的内容进行与音频对象有关的修改为主要趋势。这些修改包括音频信号的选定部分的增益修改和/或通过空间分布式扬声器在多声道回放的情况下对专用音频对象的空间重定位。这可通过分别地将音频内容的不同部分传递至不同扬声器来实现。换言之，在音频处理、音频传输及音频存储的技术中，存在允许关于面向对象式音频内容播放的用户交互的增加需求，以及存在利用多声道播放的扩展可能性分别地渲染音频内容或其部分以便改善听觉印象的要求。由此，多声道音频内容的使用为用户带来显著的改善。例如，可获得三维听觉印象，其在娱乐应用中带来改善的用户满意度。然而，多声道音频内容也适用于专业环境，例如，电话会议应用，因为通过使用多声道音频播放可以改善讲话者的可懂度。另一可能应用为使得音乐作品的收听者分别地调整不同部分（也称为 "音频对象"）或乐曲（诸如，声乐部分或不同乐器）的播放级别和/或空间位置。使用者可因为个人品味、为了更易于转录来自音乐作品的一个或多个部分、教育目的、伴唱、排演等原因而执行这种调整。所有数字多声道或多对象音频内容的直接离散传输（例如，脉冲编码调制（PCM) 数据的形式或者甚至压缩音频格式）需要非常高的比特率。然而，也需要按比特率有效的方式传输及存储音频数据。因此，人们乐于接受音频质量与比特率要求之间的合理权衡以便避免由多声道...

【技术保护点】
一种用于从包括多个时域降混样本的降混信号产生包括一个或多个音频输出声道的音频输出信号的解码器，其中所述降混信号编码两个或更多个音频对象信号，其中所述解码器包括：窗序列产生器(134)，用于确定多个分析窗，其中所述分析窗中的每个包括所述降混信号的多个时域降混样本，其中所述多个分析窗中的每个分析窗具有指示所述分析窗的所述时域降混样本的数目的窗长度，其中所述窗序列产生器(134)用于确定所述多个分析窗，以便所述分析窗中的每个的所述窗长度取决于所述两个或更多个音频对象信号中的至少一个的信号属性，t/f分析模块(135)，用于根据所述多个分析窗中的每个分析窗的窗长度将所述分析窗的所述多个时域降混样本从时域变换至时频域，以获得变换后的降混，以及解混单元(136)，用于基于关于所述两个或更多个音频对象信号的参数边信息对所述变换后的降混进行解混，以获得所述音频输出信号。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：萨沙·迪施，约尼·鲍卢斯，贝恩德·埃德勒，奥立夫·赫尔穆特，于尔根·赫勒，索尔斯腾·科斯特，
申请(专利权)人：弗朗霍夫应用科学研究促进协会，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人