用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法技术

技术编号：11765743 阅读：88 留言：0更新日期：2015-07-23 17:11

提供一种用于从降混信号产生包括一个或多个音频输出声道的音频输出信号的解码器。降混信号编码一个或多个音频对象信号。解码器包括用于根据一个或多个音频对象信号中的至少一个的信号属性将激活指示设定成激活状态的控制单元(181)。此外，解码器包括用于变换解混信号以获得包括多个第一子带声道的第一变换后的降混的第一分析模块(182)。此外，解码器包括第二分析模块(183)，用于当激活指示被设定成激活状态时，通过变换第一子带声道中的至少一个获得第二子带声道而产生第二变换后的降混，其中第二变换后的降混包括尚未被第二分析模块变换的第一子带声道及第二子带声道。此外，解码器包括解混单元(184)，其中解混单元(184)用于当激活指示被设定成激活状态时，基于关于一个或多个音频对象信号的参数边信息对第二变换后的降混进行解混以获得音频输出信号，以及当激活指示未被设定成激活状态时，基于关于一个或多个音频对象信号的参数边信息度第一变换后的降混进行解混以获得音频输出信号。此外，提供一种编码器。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法
本专利技术涉及音频信号编码、音频信号解码及音频信号处理，特别地，涉及一种用于空间音频对象编码(SAOC)中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法。
技术介绍
在现代数字音频系统中，允许在接收器侧上对所传输的内容进行与音频对象有关的修改为主要趋势。这些修改包括音频信号的选定部分的增益修改和/或通过空间分布式扬声器在多声道回放的情况下对专用音频对象的空间重定位。这可通过分别地将音频内容的不同部分传递至不同扬声器来实现。换言之，在音频处理、音频传输及音频存储的技术中，存在允许关于面向对象式音频内容播放的用户交互的增加需求，以及存在利用多声道播放的扩展可能性分别地渲染音频内容或其部分以便改善听觉印象的要求。由此，多声道音频内容的使用为用户带来显著的改善。例如，可获得三维听觉印象，其在娱乐应用中带来改善的用户满意度。然而，多声道音频内容也适用于专业环境，例如，电话会议应用，因为通过使用多声道音频播放可以改善讲话者的可懂度。另一可能应用为使得音乐作品的收听者分别地调整不同部分(也称为“音频对象”)或乐曲(诸如，声乐部分或不同乐器)的播放级别和/或空间位置。使用者可因为个人品味、为了更易于转录来自音乐作品的一个或多个部分、教育目的、伴唱、排演等原因而执行这种调整。所有数字多声道或多对象音频内容的直接离散传输(例如，脉冲编码调制(PCM)数据的形式或者甚至压缩音频格式)需要非常高的比特率。然而，也需要按比特率有效的方式传输及存储音频数据。因此，人们乐于接受音频质量与比特率要求之间的合理权衡以便...

【技术保护点】
一种用于从降混信号产生包括一个或多个音频输出声道的音频输出信号的解码器，其中所述降混信号编码一个或多个音频对象信号，其中所述解码器包括：控制单元(181)，用于根据所述一个或多个音频对象信号中的至少一个的信号属性将激活指示设定成激活状态，第一分析模块(182)，用于变换所述降混信号以获得包括多个第一子带声道的第一变换后的降混，第二分析模块(183)，用于当所述激活指示被设定成所述激活状态时，通过变换所述第一子带声道中的至少一个获得多个第二子带声道而产生第二变换后的降混，其中所述第二变换后的降混包括尚未被所述第二分析模块变换的所述第一子带声道及所述第二子带声道，以及解混单元(184)，其中所述解混单元(184)用于当所述激活指示被设定成所述激活状态时，基于关于所述一个或多个音频对象信号的参数边信息对所述第二变换后的降混进行解混以获得所述音频输出信号，以及当所述激活指示未被设定成所述激活状态时，基于关于所述一个或多个音频对象信号的所述参数边信息对所述第一变换后的降混进行解混以获得所述音频输出信号。

【技术特征摘要】
【国外来华专利技术】2013.05.13 EP 13167487.1;2012.10.05 US 61/710,1331.一种用于从降混信号产生包括一个或多个音频输出声道的音频输出信号的解码器，其中所述降混信号编码一个或多个音频对象信号，其中所述解码器包括：控制单元(181)，用于根据所述一个或多个音频对象信号中的至少一个的信号属性将激活指示设定成激活状态，第一分析模块(182)，用于变换所述降混信号以获得包括多个第一子带声道的第一变换后的降混，第二分析模块(183)，用于当所述激活指示被设定成所述激活状态时，通过变换所述第一子带声道中的至少一个获得多个第二子带声道而产生第二变换后的降混，其中所述第二变换后的降混包括尚未被所述第二分析模块变换的所述第一子带声道及所述第二子带声道，以及解混单元(184)，其中所述解混单元(184)用于当所述激活指示被设定成所述激活状态时，基于关于所述一个或多个音频对象信号的参数边信息对所述第二变换后的降混进行解混以获得所述音频输出信号，以及当所述激活指示未被设定成所述激活状态时，基于关于所述一个或多个音频对象信号的所述参数边信息对所述第一变换后的降混进行解混以获得所述音频输出信号。2.如权利要求1所述的解码器，其中所述控制单元(181)用于根据所述一个或多个音频对象信号中的至少一个中的瞬态的存在，将所述激活指示设定成所述激活状态，其中所述瞬态指示所述一个或多个音频对象信号中的至少一个的信号改变。3.如权利要求1或2所述的解码器，其中子带变换指示被分配给所述第一子带声道中的每个，其中所述控制单元(181)用于根据所述一个或多个音频对象信号中的至少一个的所述信号属性，将所述第一子带声道中的每个的所述子带变换指示设定成子带变换状态，以及其中所述第二分析模块(183)用于变换所述第一子带声道中的每个以获得所述多个第二子带声道，以及用于不变换所述第二子带声道中的每个，其中所述第一子带声道中的每个的所述子带变换指示被设定成所述子带变换状态，所述第二子带声道中的每个的所述子带变换指示未被设定成所述子带变换状态。4.如权利要求1所述的解码器，其中所述第一分析模块(182)用于通过使用正交镜相滤波器变换所述降混信号，以获得包括所述多个第一子带声道的所述第一变换后的降混。5.如权利要求1所述的解码器，其中所述第一分析模块(182)用于根据第一分析窗长度变换所述降混信号，其中所述第一分析窗长度取决于所述信号属性，或其中所述第二分析模块(183)用于当所述激活指示被设定成所述激活状态时，通过根据第二分析窗长度变换所述第一子带声道中的至少一个，产生所述第二变换后的降混，其中所述第二分析窗长度取决于所述信号属性。6.如权利要求1所述的解码器，其中所述解码器用于从所述降混信号产生包括一个或多个音频输出声道的所述音频输出信号，其中所述降混信号编码两个或更多个音频对象信号，其中所述控制单元(181)用于根据所述两个或更多个音频对象信号中的至少一个的所述信号属性，将所述激活指示设定成所述激活状态，以及其中所述解混单元(184)用于当所述激活指示被设定成所述激活状态时，基于关于所述一个或多个音频对象信号的参数边信息对所述第二变换后的降混进行解混以获得所述音频输出信号，以及当所述激活指示未被设定成所述激活状态时，基于关于所述两个或更多个音频对象信号的所述参数边信息对所述第一变换后的降混进行解混以获得所述音频输出信号。7.一种用于编码输入音频对象信号的编码器，其中所述编码器包括：控制单元(191)，用于根据所述输入音频对象信号的信号属性，将激活指示设定成激活状态，第一分析模块(192)，用于变换所述输入音频对象信号以获得第一变换后的音频对象信号，其中所述第一变换后的音频对象信号包括多个第一子带声道，第二分析模块(193)，用于当所述激活指示被设定成所述激活状态时，通过变换所述多个第一子带声道中的至少一个获得多个第二子带声道，而产生第二变换后的音频对象信号，其中所述第二变换后的音频对象信号包括尚未被所述第二分析模块变换的所述第一子带声道及所述第二子带声道，以及PSI估计单元(194)，其中所述PSI估计单元(194)用于当所述激活指示被设定成所述激活状态时，基于所述第二变换后的音频对象信号确定参数边信息，以及当所述激活指示未被设定成所述激活状态时，基于所述第一变换后的音频对象信号确定所述...

【专利技术属性】
技术研发人员：萨沙·迪施，约尼·鲍卢斯，贝恩德·埃德勒，奥立夫·赫尔穆特，于尔根·赫勒，索尔斯腾·科斯特，
申请(专利权)人：弗朗霍夫应用科学研究促进协会，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人