【技术实现步骤摘要】
音频数据编解码方法和相关装置及计算机可读存储介质
[0001]本申请涉及音频
,尤其涉及音频数据编解码方法和相关通信装置及相关计算机可读存储介质。
技术介绍
[0002]目前,随着社会的进步和技术的不断发展,用户对音视频服务的需求越来越高。如何在有限编码比特率的情况下为用户提供更高质量的服务,或利用更低的编码比特率为用户提供相同质量的服务,一直以来都是音视频编解码研究的重点。一些国际标准组织(例如第三代合作伙伴计划(3GPP,3rd Generation Partner Project))也在参与相关标准的制定工作,以推动音视频服务向高质量迈进。
[0003]音视频压缩是媒体通信和媒体广播等媒体应用中不可或缺的环节。随着高清音视频产业以及3D产业的发展,人们对音视频质量的需求越来越高,随之而来的是媒体应用中音视频数据量的迅猛增长。
[0004]传统的音视频压缩技术都是基于信号处理的基本原理,在时间、空间上利用信号的相关性对原始的音视频数据进行压缩,减少数据量,使其便于传输或存储。
[0005]随 ...
【技术保护点】
【技术特征摘要】
1.一种音频数据编码方法,其特征在于,包括:获取待编码的音频数据;利用编码神经网络对所述待编码的音频数据进行处理以生成第一潜在变量;对所述第一潜在变量进行量化处理以得到第二潜在变量;根据所述第一潜在变量和所述第二潜在变量得到潜在变量补偿参数;将所述潜在变量补偿参数进行编码,并将所述潜在变量补偿参数的编码结果写入码流;将所述第二潜在变量进行编码,并将所述第二潜在变量的编码结果写入码流。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一潜在变量和所述第二潜在变量得到潜在变量补偿参数,包括:确定第三潜在变量或所述第二潜在变量中满足预设条件的元素,所述第三潜在变量是通过对所述第二潜在变量进行去量化处理而得到;根据所述第一潜在变量和所述第二潜在变量或根据所述第一潜在变量和所述第三潜在变量得到所述满足预设条件的元素的量化误差;根据所述量化误差得到所述潜在变量补偿参数。3.根据权利要求2所述的方法,其特征在于,所述第三潜在变量或所述第二潜在变量包括第一元素;所述满足预设条件包括:所述第一元素的值小于或等于预设值;其中,当所述第一元素是所述第二潜在变量中的元素时,所述第一元素的值是量化值,或当所述第一元素是所述第三潜在变量中的元素时,所述第一元素的值是去量化值。4.根据权利要求2所述的方法,其特征在于,根据所述第一潜在变量和所述第二潜在变量得到所述满足条件的元素的量化误差包括:根据所述第一潜在变量中第一元素的第一值以及所述第二潜在变量中所述第一元素的第二值确定所述第一元素的量化误差;或所述根据所述第一潜在变量和所述第三潜在变量得到所述满足预设条件的元素的量化误差包括:根据所述第一潜在变量中第一元素的第一值以及所述第三潜在变量中所述第一元素的第三值确定所述第一元素的量化误差。5.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为全连接神经网络或卷积神经网络,所述卷积神经网络仅包括一个通道;所述潜在变量补偿参数为标量,其中,所述标量用于指示所述第二潜在变量中满足预设条件的所有元素的量化误差,或所述标量用于指示所述第三潜在变量中满足预设条件的所有元素的量化误差。6.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网络,所述卷积神经网络包括至少两个通道,所述第二潜在变量与所述至少两个通道对应,所述至少两个通道包括第一通道,所述第二潜在变量是一个m
×
n矩阵;其中,所述潜在变量补偿参数为标量,所述标量用于指示所述第二潜在变量中满足预设条件
的所有元素的量化误差;或,所述潜在变量补偿参数为矢量,所述矢量的维数等于所述卷积神经网络的通道数,所述矢量中的矢量元素与所述至少两个通道一一对应,所述矢量元素中的第一矢量元素与所述第一通道对应,所述第一矢量元素用于指示所述m
×
n矩阵的子矩阵中满足预设条件的所有元素的量化误差,所述第一通道对应于所述子矩阵,所述子矩阵的元素数量小于m
×
n。7.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网络,所述卷积神经网络包括至少三个通道,所述第二潜在变量与所述至少三个通道对应,所述第二潜在变量是一个m
×
n矩阵;所述潜在变量补偿参数为矢量,所述矢量的维数小于所述卷积神经网络的通道数,所述矢量中的第一矢量元素与所述至少三个通道中的至少两个通道对应,所述至少两个通道包括第二通道和第一通道,其中,所述第一矢量元素用于指示所述m
×
n矩阵的第一子矩阵中满足预设条件的所有元素的量化误差,所述第一矢量元素还用于指示所述m
×
n矩阵的第二子矩阵中满足预设条件的所有元素的量化误差,其中,所述第一子矩阵与所述第一通道对应,所述第二子矩阵与所述第二通道对应,所述第一子矩阵的元素数量小于m
×
n,所述第二子矩阵的元素数量小于m
×
n。8.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网络,所述卷积神经网络包括至少两个通道,所述第三潜在变量与所述至少两个通道对应,所述至少两个通道包括第一通道,所述第三潜在变量是一个m
×
n矩阵;其中,所述潜在变量补偿参数为标量,所述标量用于指示所述第三潜在变量中满足预设条件的所有元素的量化误差;或,所述潜在变量补偿参数为矢量,所述矢量的维数等于所述卷积神经网络的通道数,所述矢量中的矢量元素与所述至少两个通道一一对应,所述矢量元素中的第一矢量元素与所述第一通道对应,所述第一矢量元素用于指示所述m
×
n矩阵的子矩阵中满足预设条件的所有元素的量化误差,所述第一通道对应所述子矩阵,所述子矩阵的元素数量小于m
×
n。9.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网络,所述卷积神经网络包括至少三个通道,所述第三潜在变量与所述至少三个通道对应,所述第三潜在变量是一个m
×
n矩阵;所述潜在变量补偿参数为矢量,所述矢量的维数小于所述卷积神经网络的通道数,所述矢量中的第一矢量元素与所述至少三个通道中的至少两个通道对应,所述至少两个通道包括第二通道和第一通道,其中,所述第一矢量元素用于指示所述m
×
n矩阵的第一子矩阵中满足预设条件的所有元素的量化误差,所述第一矢量元素还用于指示所述m
×
n矩阵的第二子矩阵中满足预设条件的所有元素的量化误差,其中,所述第一子矩阵与所述第一通道对应,所述第二子矩阵与所述第二通道对应,所述第一子矩阵的元素数量小于m
×
n,所述第二子矩阵的元素数量小于m
×
n。10.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网
络,所述卷积神经网络包括至少两个通道,所述第二潜在变量与所述至少两个通道中的第一通道对应;其中,所述潜在变量补偿参数为标量,所述标量用于指示与所述至少两个通道对应的至少两个潜在变量中满足预设条件的所有元素的量化误差,所述至少两个潜在变量包括所述第二潜在变量;或,所述潜在变量补偿参数为矢量,所述矢量的维数等于所述卷积神经网络的通道数,所述矢量中的矢量元素与所述至少两个通道一一对应,所述矢量元素包括与所述第一通道对应的第一矢量元素,所述第一矢量元素用于指示所述第二潜在变量中满足预设条件的所有元素的量化误差。11.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网络,所述卷积神经网络包括至少三个通道,所述第二潜在变量与所述至少三个通道中的第一通道对应;其中,所述潜在变量补偿参数为矢量,所述矢量的维数小于所述卷积神经网络的通道数,所述矢量中的第一矢量元素与所述至少三个通道中的至少两个通道对应,所述至少两个通道包括第二通道和所述第一通道,所述第一矢量元素用于指示所述第二潜在变量中满足预设条件的所有元素的量化误差,所述第一矢量元素还用于指示所述第二通道对应的另一潜在变量中满足预设条件的所有元素的量化误差。12.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网络,所述卷积神经网络包括至少两个通道,所述第三潜在变量与所述至少两个通道中的第一通道对应;其中,所述潜在变量补偿参数为标量,所述标量用于指示与所述至少两个通道对应的至少两个潜在变量中满足预设条件的所有元素的量化误差,所述至少两个潜在变量包括所述第三潜在变量;或,所述潜在变量补偿参数为矢量,所述矢量的维数等于所述卷积神经网络的通道数,所述矢量中的矢量元素与所述至少两个通道一一对应,与所述第一通道对应的矢量元素用于指示所述第三潜在变量中满足预设条件的所有元素的量化误差。13.根据权利要求2至4任一所述的方法,其特征在于,所述编码神经网络为卷积神经网络,所述卷积神经网络包括至少三个通道,所述第三潜在变量与所述至少三个通道中的第一通道对应;其中,所述潜在变量补偿参数为矢量,所述矢量的维数小于所述卷积神经网络的通道数,所述矢量中的第一矢量元素与所述至少三个通道中的至少两个通道对应,所述至少两个通道...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。