编解码方法、装置、设备、存储介质及计算机程序制造方法及图纸

技术编号：37104629 阅读：22 留言：0更新日期：2023-04-01 05:03

本申请实施例公开了一种编解码方法、装置、设备、存储介质及计算机程序，属于三维音频编解码技术领域。在该方法中，对当前帧的时域三维音频信号包括的M个通道的信号分别进行暂态检测，以得到M个暂态检测结果，基于M个暂态检测结果确定全局暂态检测结果，基于全局暂态检测结果，将时域三维音频信号转换为频域三维音频信号，以及对频域三维音频信号进行空间编码以得到空间编码参数和N个传输通道的频域信号，基于全局暂态检测结果对N个传输通道的频域信号进行编码以得到频域信号编码结果，将空间编码参数进行编码以得到空间编码参数编码结果，将空间编码参数编码结果和频域信号编码结果写入码流。这样，能够降低编码复杂度，提高编码效率。编码效率。编码效率。

全部详细技术资料下载

【技术实现步骤摘要】
编解码方法、装置、设备、存储介质及计算机程序

[0001]本申请实施例涉及三维音频编解码
，特别涉及一种编解码方法、装置、设备、存储介质及计算机程序。

技术介绍

[0002]三维音频技术是通过计算机、信号处理等方式对真实世界中声音事件和三维声场信息进行获取、处理、传输和渲染回放的音频技术。为了实现更好的音频听觉效果，三维音频信号通常需要包括大量的数据量，以此来更详细地记录声音场景的空间信息。然而，大量的数据量在传输和存储的过程中存在困难，因此需要对三维音频信号进行编解码。
[0003]高阶立体混响(higher order ambisonics，HOA)音频技术作为一种三维音频技术，因其在录制、编码与回放阶段具有与扬声器布局无关的性质，以及HOA格式数据具有可旋转回放的特性，所以HOA信号在进行回放时具有更高的灵活性，因而得到了更为广泛的关注。
[0004]相关技术提出了一种对HOA信号进行编码的方法，在该方法中，先对时域HOA信号进行时频变换，以得到频域HOA信号，对频域HOA信号进行空间编码，以得到...

【技术保护点】

【技术特征摘要】
1.一种编码方法，其特征在于，所述方法包括：对当前帧的时域三维音频信号包括的M个通道的信号分别进行暂态检测，以得到所述M个通道对应的M个暂态检测结果，所述M为大于1的整数；基于所述M个暂态检测结果，确定全局暂态检测结果；基于所述全局暂态检测结果，将所述时域三维音频信号转换为频域三维音频信号；基于所述全局暂态检测结果，对所述频域三维音频信号进行空间编码，以得到空间编码参数和N个传输通道的频域信号，所述N为大于或等于1且小于或等于所述M的整数；基于所述全局暂态检测结果，对所述N个传输通道的频域信号进行编码，以得到频域信号编码结果；将所述空间编码参数进行编码，以得到空间编码参数编码结果；将所述空间编码参数编码结果和所述频域信号编码结果写入码流。2.如权利要求1所述的方法，其特征在于，所述基于所述全局暂态检测结果，将所述时域三维音频信号转换为频域三维音频信号，包括：基于所述全局暂态检测结果确定目标编码参数，所述目标编码参数包括所述当前帧的窗函数类型和/或所述当前帧的帧类型；基于所述目标编码参数将所述时域三维音频信号转换为所述频域三维音频信号。3.如权利要求2所述的方法，其特征在于，所述全局暂态检测结果包括全局暂态标志，所述目标编码参数包括所述当前帧的窗函数类型；所述基于所述全局暂态检测结果确定目标编码参数，包括：若所述全局暂态标志为第一值，则将第一预设窗函数的类型确定为所述当前帧的窗函数类型；若所述全局暂态标志为第二值，则将第二预设窗函数的类型确定为所述当前帧的窗函数类型；其中，所述第一预设窗函数的窗长小于所述第二预设窗函数的窗长。4.如权利要求2所述的方法，其特征在于，所述全局暂态检测结果包括全局暂态标志和全局暂态位置信息，所述目标编码参数包括所述当前帧的窗函数类型；所述基于所述全局暂态检测结果确定目标编码参数，包括：若所述全局暂态标志为第一值，则基于所述全局暂态位置信息确定所述当前帧的窗函数类型。5.如权利要求2
‑
4任一所述的方法，其特征在于，所述方法还包括：将所述目标编码参数进行编码，以得到目标编码参数编码结果；将所述目标编码参数编码结果写入所述码流。6.如权利要求2
‑
5任一所述的方法，其特征在于，所述基于所述全局暂态检测结果，对所述频域三维音频信号进行空间编码，包括：基于所述帧类型，对所述频域三维音频信号进行空间编码。7.如权利要求2
‑
6任一所述的方法，其特征在于，所述基于所述全局暂态检测结果，对所述N个传输通道的频域信号进行编码，包括：基于所述当前帧的帧类型，对所述N个传输通道的频域信号进行编码。8.如权利要求1
‑
7任一所述的方法，其特征在于，所述暂态检测结果包括暂态标志，所
述全局暂态检测结果包括全局暂态标志，所述暂态标志用于指示对应通道的信号是否为暂态信号；所述基于所述M个暂态检测结果，确定全局暂态检测结果，包括：若所述M个暂态标志中为第一值的暂态标志的数量大于或等于m，则确定所述全局暂态标志为第一值，所述m为大于0且小于所述M的正整数；或者若所述M个通道中满足第一预设条件且对应的暂态标志为第一值的通道数量大于或等于n，则确定所述全局暂态标志为第一值，所述n为大于0且小于所述M的正整数。9.如权利要求8所述的方法，其特征在于，所述暂态检测结果还包括暂态位置信息，所述全局暂态检测结果还包括全局暂态位置信息，所述暂态位置信息用于指示对应通道的信号中暂态发生的位置；所述基于所述M个暂态检测结果，确定全局暂态检测结果，包括：若所述M个暂态标志中仅有一个暂态标志为第一值，则将所述暂态标志为第一值的通道对应的暂态位置信息确定为所述全局暂态位置信息；若所述M个暂态标志中存在至少两个暂态标志为第一值，则将所述至少两个暂态标志对应的至少两个通道中暂态检测参数最大的通道对应的暂态位置信息确定为所述全局暂态位置信息。10.如权利要求1
‑
9任一所述的方法，其特征在于，所述方法还包括：将所述全局暂态检测结果进行编码，以得到全局暂态检测结果编码结果；将所述全局暂态检测结果编码结果写入所述码流。11.一种解码方法，其特征在于，所述方法包括：从码流中解析出全局暂态检测结果和空间编码参数；基于所述全局暂态检测结果和所述码流进行解码，以得到N个传输通道的频域信号；基于所述全局暂态检测结果和所述空间编码参数，对所述N个传输通道的频域信号进行空间解码，以得到重建的频域三维音频信号；基于所述全局暂态检测结果和所述重建的频域三维音频信号，确定重建的时域三维音频信号。12.如权利要求11所述的方法，其特征在于，所述基于所述全局暂态检测结果和所述重建的频域三维音频信号，确定重建的时域三维音频信号，包括：基于所述全局暂态检测结果确定目标编码参数，所述目标编码参数包括当前帧的窗函数类型和/或所述当前帧的帧类型；基于所述目标编码参数，将所述重建的频域三维音频信号转换为所述重建的时域三维音频信号。13.如权利要求12所述的方法，其特征在于，所述全局暂态检测结果包括全局暂态标志，所述目标编码参数包括所述当前帧的窗函数类型；所述基于所述全局暂态检测结果确定目标编码参数，包括：若所述全局暂态标志为第一值，则将第一预设窗函数的类型确定为所述当前帧的窗函数类型；若所述全局暂态标志为第二值，则将第二预设窗函数的类型确定为所述当前帧的窗函数类型；
其中，所述第一预设窗函数的窗长小于所述第二预设窗函数的窗长。14.如权利要求12所述的方法，其特征在于，所述全局暂态检测结果包括全局暂态标志和全局暂态位置信息，所述目标编码参数包括所述当前帧的窗函数类型；所述基于所述全局暂态检测结果确定目标编码参数，包括：若所述全局暂态标志为第一值，则基于所述全局暂态位置信息确定所述当前帧的窗函数类型。15.一种编码装置，其特征在于，所述装置包括：暂态检测模块，用于对当前帧的时域三维音频信号包括的M个通道的信号分别进行暂态检测，以得到所述M个通道对应的M个暂态检测结果，所述M为大于1的整数；确定模块，用于基于所述M个暂态检测结果，确定全局暂态检测结果；转换模块，用于基于所述全局暂态检测结果，将所述时域三维音频信号转换为频域三维音频信号；空间编码模块，用于基于所述全局暂态检测结果，对所述频域三维音频信号...

【专利技术属性】
技术研发人员：刘帅，高原，王宾，王喆，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人