【技术实现步骤摘要】
音频编码及解码方法、装置、设备、介质及程序产品
[0001]本申请涉及音频处理技术,尤其涉及一种音频编码及解码方法、装置、设备、介质及程序产品。
技术介绍
[0002]音频编解码技术,是包括远程音视频通话在内的通信服务中的一项核心技术。传统的编解码技术是基于时域和频域的变换实现,例如各种标准的语音编解码协议都属于此范畴。以编码为例,包括时域编码和频域编码,其本质都是基于信号处理的压缩方法,在保持一定的语音质量的前提下,编码的码率很难再有明显的下降,因为二者是相互制约的。
[0003]人工智能(Artificial Intelligence,AI)是计算机科学的一个综合技术,在音频编码领域的应用日渐增多,例如基于深度学习的编解码技术,目标是在低码率下实现高于传统的编解码技术的语音质量。但是,由于人工智能的编解码技术的计算复杂度较高,影响了编码效率,且码率较高时也无法适用于低带宽的应用场景。
[0004]综上所述,如何适用不同网络带宽的应用场景来提升编解码的效率和语音质量,相关技术尚无有效解决方案。
技术实现思路
[0005]本申请实施例提供一种音频编码及解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够灵活适用于不同网络带宽的应用场景,提升音频编解码的效率和质量。
[0006]本申请实施例的技术方案是这样实现的:
[0007]本申请实施例提供一种音频编码方法,包括:
[0008]对音频信号进行分解处理,得到低频子带信号和高频子带信号;
[0 ...
【技术保护点】
【技术特征摘要】
1.一种音频编码方法,其特征在于,所述方法包括:对音频信号进行分解处理,得到低频子带信号和高频子带信号;基于所述低频子带信号以及所述高频子带信号进行多个层次的特征提取处理,得到所述多个层次分别对应的子带信号特征;对每个所述层次对应的子带信号特征进行量化处理,得到所述子带信号特征的索引值;对所述子带信号特征的索引值进行编码处理,得到所述层次对应的码流;对所述多个层次分别对应的码流配置对应的传输优先级;其中,所述传输优先级与所述层次对应的码流的解码质量指标正相关。2.根据权利要求1所述的方法,其特征在于,所述对音频信号进行分解处理,得到低频子带信号和高频子带信号,包括:以第一采样频率对所述音频信号进行采样处理,得到采样信号;其中,所述采样信号包括从所述音频信号中采样得到的多个样本点;对所述采样信号进行低通滤波处理,对得到的低通滤波结果进行第一下采样处理,得到第二采样频率的所述低频子带信号;对所述采样信号进行高通滤波处理,对得到的高通滤波结果进行第二下采样处理,得到所述第二采样频率的所述高频子带信号;其中,所述第二采样频率为所述第一采样频率的二分之一,所述低频子带信号和所述高频子带信号的带宽相同。3.根据权利要求1所述的方法,其特征在于,所述多个层次包括第一层次和第二层次;所述基于所述低频子带信号以及所述高频子带信号进行多个层次的特征提取处理,得到所述多个层次分别对应的子带信号特征,包括:通过以下方式执行所述第一层次的特征提取处理:基于所述低频子带信号进行第一特征提取处理,得到第一低频子带信号特征;其中,所述第一低频子带信号特征的维度小于所述低频子带信号的维度;通过以下方式执行所述第二层次的特征提取处理:基于所述高频子带信号进行第二特征提取处理,得到第一高频子带信号特征;其中,所述第一高频子带信号特征的维度小于所述高频子带信号的维度。4.根据权利要求3所述的方法,其特征在于,所述基于所述低频子带信号进行第一特征提取处理,得到第一低频子带信号特征,包括:对所述低频子带信号进行第一卷积处理,得到第一卷积特征;对所述第一卷积特征进行第一池化处理,得到第一池化特征;对所述第一池化特征进行第三下采样处理,得到第三下采样特征;其中,所述第三下采样处理包括多次级联的下采样;对所述第三下采样特征进行第二卷积处理,得到所述第一低频子带信号特征。5.根据权利要求3或4所述的方法,其特征在于,所述高频子带信号包括第一数量的样本点,所述第一数量为大于2的整数;
所述基于所述高频子带信号进行第二特征提取处理,得到第一高频子带信号特征,包括:基于所述第一数量的样本点分别进行频域变换处理,得到所述第一数量的变换系数;将所述第一数量的变换系数划分为多个第一子带;针对每个所述第一子带执行以下处理:基于所述第一子带中第二数量的变换系数进行求均值处理,得到所述第一子带对应的第一平均能量,并将所述第一平均能量确定为所述第一子带对应的第一子带谱包络;其中,所述第二数量是所述第一数量与所述多个第一子带的数量的比值;将所述多个第一子带分别对应的所述第一子带谱包络确定为所述第一高频子带信号特征。6.根据权利要求5所述的方法,其特征在于,所述基于所述第一数量的样本点分别进行频域变换处理,得到所述第一数量的变换系数,包括:获取参考帧音频信号对应的参考帧高频子带信号;其中,所述参考帧音频信号是所述音频信号的上一帧或下一帧,所述参考帧高频子带信号包括所述第一数量的样本点;基于所述参考帧高频子带信号中所述第一数量的样本点与所述高频子带信号中所述第一数量的样本点,对所述高频子带信号包括的所述第一数量的样本点分别进行离散余弦变换处理,得到所述高频子带信号包括的所述第一数量的样本点分别对应的变换系数。7.根据权利要求5所述的方法,其特征在于,所述多个层次还包括第三层次;所述方法还包括:通过以下方式执行所述第三层次的特征提取处理:基于所述低频子带信号以及所述第一低频子带信号特征进行第三特征提取处理,得到第二低频子带信号特征;基于所述第一高频子带信号特征进行第四特征提取处理,得到第二高频子带信号特征。8.根据权利要求7所述的方法,其特征在于,所述基于所述低频子带信号以及所述第一低频子带信号特征进行第三特征提取处理,得到第二低频子带信号特征,包括:对所述低频子带信号以及所述第一低频子带信号特征进行拼接处理,得到拼接特征;对所述拼接特征进行第三卷积处理,得到第三卷积特征;对所述第三卷积特征进行第二池化处理,得到第二池化特征;对所述第二池化特征进行第四下采样处理,得到第四下采样特征;其中,所述第四下采样处理包括多次级联的下采样;对所述第四下采样特征进行第四卷积处理,得到所述第二低频子带信号特征;其中,所述第二低频子带信号特征的维度小于所述第一低频子带信号特征的维度。9.根据权利要求7所述的方法,其特征在于,所述基于所述第一高频子带信号特征进行第四特征提取处理,得到第二高频子带信号特征,包括:针对所述第一高频子带信号特征对应的每个所述第一子带执行以下处理:
从所述第一子带中所述第二数量的变换参数中,选择第三数量的变换参数,将所述第三数量的变换系数确定为第二子带;其中,所述第三数量为所述第二数量的二分之一;基于所述第二子带中所述第三数量的变换系数进行求均值处理,得到所述第二子带对应的第二平均能量,并将所述第二平均能量确定为所述第二子带对应的第二子带谱包络;将每个所述第二子带分别对应的所述第二子带谱包络确定为所述第二高频子带信号特征。10.根据权利要求1所述的方法,其特征在于,所述多个层次包括第一层次和第二层次,且所述第一层次对应的子带信号特征为第一低频子带信号特征,所述第二层次对应的子带信号特征为第一高频子带信号特征;所述对所述子带信号特征的索引值进行编码处理,得到所述层次对应的码流,包括:对所述第一低频信号特征的索引值进行编码处理,得到所述第一层次对应的所述第一码流;对所述第一高频信号特征的索引值进行编码处理,得到所述第二层次对应的所述第二码流;其中,所述第一码流的码率大于所述第二码流对应的码率,且所述码率与对应的码流的解码质量指标正相关。11.根据权利要求10所述的方法,其特征在于,所述多个层次包括还包括第三层次,且所述第三层次对应的子带信号特征为第二低频子带信号特征和第二高频子带信号特征;所述方法还包括:对所述第二低频信号特征的索引值进行编码处理,得到所述第三层次对应的第三码流;对所述第二高频信号特征的索引值进行编码处理,得到所述第三层次对应的第四码流;其中,所述第一码流的码率大于所述第三码流的码率,所述第三码流的码率大于所述第二码流的码率,所述第二码流的码率等于所述第四码流的码率,且所述码率与对应的码流的解码质量指标正相关。12.根据权利要求1所述的方法,其特征在于,所述多个层次包括第一层次和第二层次,且所述第一层次对应的第一码流是对第一低频信号特征的索引值进行编码处理得到的,所述第二层次对应的第二码流是对第一高频信号特征的索引值进行编码处理得到的;所述对所述多个层次分别对应的码流配置对应的传输优先级,包括:对所述第一层次对应的所述第一码流配置第一传输优先级;对所述第二层次对应的所述第二码流配置第二传输优先级;其中,所述第一传输优先级高于所述第二传输优先级。13.根据权利要求12所述的方法,其特征在于,所述多个层次包括还包括第三层次,且所述第三层次对应第三码流和第四码流,所述第三码流是对第二低频信号特征的索引值进行编码处理得到的,所述第四码流是对第二高频信号特征的索引值进行编码处理得到的;
所述方法还包括:对所述第三层次对应的所述第三码流配置第三传输优先级;对所述第三层次对应的所述第四码流配置第四传输优先级;其中,所述第一传输优先级高于所述第三传输优先级,所述第三传输优先级高于所述第二传输优先级,所述第二传输优先级与所述第四传输优先级相同。14.一种音频解码方法,其特征在于,所述方法包括:对多个层次分别对应的码流进行解码处理,得到每个所述层次分别对应的码流的索引值;其中,不同的所述层次对应不同的传输优先级,且所述传输优先级与所述层次对应的码流的解码质量指标正相关;对每个所述层次分别对应的码流的索引值进行逆量化处理,得到每个所述层次分别对应的子带信号特征;对每个所述层次分别对应的子带信号特征进行特征重建处理,得到每个所述层次分别对应的子带信号;将多个所述层次分别对应的子带信号合成为音频信号。15.根据权利要求14所述的方法,其特征在于,所述多个层次包括第一层次和第二层次,所述第一层次对应第一低频子带信号特征,所述第二层次对应第一高频子带信号特征;所述对每个所述层次分别对应的子带信号特征进行特征重建处理,得到每个所述层次分别对应的子带信号,包括:通过以下方式执行所述第一层次的特征重建处理:基于所述第一低频子带信号特征进行第一特征重建处理,得到第一低频子带信号;其中,所述第一低频子带信号的维度大于所述第一低频子带信号特征的维度;通过以下方式执行所述第二层次的特征重建处理:基于所述第一高频子带信号特征进行第二特征重建处理,得到第一高频子带信号;其中,所述第一高频子带信号的维度大于所述第一高频子带信号特征的维度。16.根据权利要求15所述的方法,其特征在于,所述基于所述第一低频子带信号特征进行第一特征重建处理,得到第一低频子带信号,包括:对所述第一低频子带信号特征进行第一卷积处理,得到第一卷积特征;对所述第一卷积特征进行第一上采样处理,得到第一上采样特征;其中,所述第一上采样处理包括多次级联的上采样;对所述第一上采样特征进行第一池化处理,得到第一池化特征;对所述第一池化特征进行第二卷积处理,得到所述第一低频子带信号。17.根据权利要求15或16所述的方法,其特征在于,所述基于所述第一高频子带信号特征进行第二特征重建...
【专利技术属性】
技术研发人员:肖玮,黄庆博,王蒙,康迂勇,史裕鹏,商世东,吴祖榕,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。