一种应用于低码率下的多音频对象编解码方法技术

技术编号：29212136 阅读：32 留言：0更新日期：2021-07-10 00:49

本发明专利技术公开了一种应用于低码率下的多音频对象编解码方法，编码阶段本方法首先将输入的多个音频对象变换到频域；然后将频域的音频对象信号下混得到混合信号，并计算单个音频对象子带被细分后的边信息矩阵；其次利用卷积自编码器中的编码模块对边信息矩阵进行降维表达；最后将混合信号和降维后的边信息合成码流。解码阶段首先分解接收到的码流，得到下混信号和边信息；然后在卷积自编码器解码器网络中引入稠密连接模块从边信息的低维结构中重构原始高维的边信息数据，最后将重建的频域音频对象信号变换为时域信号。本发明专利技术可以在低码率下全面提升音频对象信号的解码质量，以满足用户对音频对象个性化控制的需求。用户对音频对象个性化控制的需求。用户对音频对象个性化控制的需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于低码率下的多音频对象编解码方法

[0001]本专利技术属于数字音频信号处理
，涉及一种利用卷积自编码器和稠密连接混合网络压缩边信息与重建的音频对象编码解码方法，适用于低码率下的空间音频个性化交互系统，允许在用户根据自身需求调整音频对象。

技术介绍

[0002]三维(3D)音频表示具有3个自由度(例如方位角，仰角和距离)的音频对象。它可以在3D空间中的任何位置形成声音图像。3D音频技术主要用于娱乐系统，以提供身临其境和个性化的体验。沉浸式的空间声音表示方式分为三种：基于声道的编码技术、基于高阶环境音的编码技术和基于对象的编码技术。基于声道的声音表示是将每个声道信号馈送到相对于听者位置固定的扬声器上。虽然基于声道的编码技术已经很成熟，然而该技术所产生的音频内容与特定的扬声器配置相关联，且该技术受到通道数量的限制，并且不能满足用户对音频对象个性化操作的需求，尤其是在沉浸式场景中，例如虚拟现实和增强现实的体感互动游戏。基于高阶环境音的编码技术使用系数信号来重建3D空间声场。虽然系数信号与声道或对象都没有直接关系，但基与高阶环境音的编码技术不适合对声音场景中单个对象的控制。基于对象的编码方法中每个音频对象位置完全独立于扬声器位置，结合个性化的渲染系统，将对象信号渲染到目标位置。因此基于对象的编码方法克服了产生的音频内容对扬声器位置的依赖。而且实现声音场景中高度沉浸式效果，例如鸟儿或直升机在头顶飞过，雨水从天空中落下，雷声从任何方向传来的听音效果。基于对象的编码框架已成功用于Dolby Atmos。
[0...

【技术保护点】

【技术特征摘要】
1.一种应用于低码率下的多音频对象编解码方法，其特征在于：包括编码方法和解码方法；所述编码方法，具体实现包括以下步骤：步骤A1：对输入的J个独立音频信号通过改进离散余弦变换MDCT进行时域
‑
频域变换，得到对象信号的频谱；步骤A2：对步骤A1得到的每帧频谱数据进行精细的子带划分；其中，根据子带数量对频谱混叠失真的影响，确定精细的子带划分的数量；步骤A3：对步骤A2中的子带，计算所有对象的下混信号，获得下混信号码流；步骤A4：对步骤A2中的子带，计算每个对象的边信息，得到边信息矩阵；步骤A5：对A3得到的边信息矩阵传入卷积自编码器的编码器模块中，得到音频对象边信息的低维特征表达结果R，然后根据查表法对边信息值进行量化，获得边信息码流；步骤A6：将步骤A3和步骤A5得到的码流合成输出码流，传输到解码端。2.根据权利要求1所述的应用于低码率下的多音频对象编解码方法，其特征在于：步骤A1中，通过2048点改进离散余弦变换MDCT对时域的音频对象信号进行时域
‑
频域变换，得到单个对象的频谱。3.根据权利要求1所述的应用于低码率下的多音频对象编解码方法，其特征在于：步骤A2中，根据子带数量对恢复音频对象频谱混叠失真的影响，利用评价指标SDR确定精细的子带划分数量。4.根据权利要求1所述的应用于低码率下的多音频对象编解码方法，其特征在于：步骤A3中，将所有对象的频谱信息进行矩阵相加，得到下混信号数据。5.根据权利要求1
‑
4任意一项所述的应用于低码率下的多音频对象编解码方法，其特征在于：步骤A4中，对象的边信息为其中，P
j
(i,b)表示对象j在子带(i,b)的能量，I是总帧数，J是对象的个数，B是子带数量；1≤i≤I，1≤j≤J，1≤b≤B。6.一种应用于低码率下的多音频对象编解码方法，其特征在于：包括编码方法和解码方法；所述解码方法，具体实现包括以下步骤：步骤B1：分解接收到的码流，得到下混信号码流和边信息码流；步骤B2：步骤B1得到的下混信号码流解码得到下混信号；步骤B3：步骤B1得到的边信息码流经过去量化...

【专利技术属性】
技术研发人员：胡瑞敏，吴玉林，王晓晨，胡晨昊，柯善发，张灵鲲，刘文可，
申请(专利权)人：武汉大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人