【技术实现步骤摘要】
一种音频处理方法及相关装置
[0001]本申请涉及人工智能
,尤其涉及一种音频处理方法及相关装置。
技术介绍
[0002]在音频传输时,为降低传输宽带和存储空间,且为了保持较好的音频质量,需要在音频发送端通过音频编码技术对音频进行压缩处理,当接收端接收到压缩后的音频后,需要对压缩后的音频进行音频解码,得到完整的音频信息。
[0003]现有的音频编码技术中,音频编码器的编码参数设定的原则是基于前期实验获取的编码参数的经验值,例如通过主观体验测定方法对不同编码参数的最终效果进行主观打分,根据主观评分确定业务最终选定的音频编码参数,被选定的编码参数值将被固化用于实际业务中。但是,不同音频信号在音频编码器内部的压缩损伤存在较大差异,采用相同编码参数对不同音频信号进行编码,导致音频质量差异较大,存在音频质量较差的情况。
技术实现思路
[0004]本申请实施例提供了一种音频处理方法以及相关装置,通过预测音频信号的音频类型,根据音频类型匹配音频编码参数,提高音频编码质量。
[0005]本申请的一方面提 ...
【技术保护点】
【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:获取目标音频信号及第一映射关系,其中,所述目标音频信号包括K个第一音频帧,所述第一映射关系用于表征音频类型与音频编码参数的对应关系,K为大于1的整数;对所述目标音频信号进行时频特征转换,得到目标频域特征序列,其中,所述目标频域特征序列包括K个目标频域特征;将所述K个目标频域特征作为信号分类模型的输入,通过所述信号分类模型输出第一预测结果,其中,所述第一预测结果用于表征所述目标音频信号的音频类型;根据所述第一预测结果及所述第一映射关系,得到所述目标音频信号对应的音频编码参数;根据所述音频编码参数对所述目标音频信号进行编码。2.如权利要求1所述的音频处理方法,其特征在于,所述信号分类模型包括稠密连接型卷积网络、循环神经网络、特征融合网络及分类网络;所述将所述K个目标频域特征作为信号分类模型的输入,通过所述信号分类模型输出第一预测结果,包括:将所述K个目标频域特征作为稠密连接型卷积网络的输入,通过所述稠密连接型卷积网络输出K个卷积特征向量,其中,所述稠密连接型卷积网络包括至少两个卷积层,每个卷积层的输出会作为下一个卷积层的输入;将所述K个卷积特征向量作为循环神经网络的输入,通过所述循环神经网络输出K个循环特征向量,其中,所述循环神经网络包括至少两个门控循环层,每个门控循环层输出会作为下一个门控循环层的输入;将所述K个循环特征向量作为所述特征融合网络的输入,通过所述特征融合网络输出融合特征向量,其中,所述特征融合网络用于将K个循环特征向量进行向量拼接;将所述融合特征向量作为所述分类网络的输入,通过所述分类网络输出第一预测结果。3.如权利要求2所述的音频处理方法,其特征在于,所述稠密连接型卷积网络包括第一卷积层、第二卷积层及第三卷积层;所述将所述K个目标频域特征作为稠密连接型卷积网络的输入,通过所述稠密连接型卷积网络输出K个卷积特征向量,包括:获取第一目标频域特征,其中,所述第一目标频域特征为K个目标频域特征中任意的目标频域特征;将所述第一目标频域特征作为第一卷积层的输入,通过所述第一卷积层输出第一卷积特征向量;将所述第一目标频域特征及所述第一卷积特征向量作为第二卷积层的输入,通过所述第二卷积层输出第二卷积特征向量;将所述第一目标频域特征、所述第一卷积特征向量及所述第二卷积特征向量作为第三卷积层的输入,通过所述第三卷积层输出第三卷积特征向量。4.如权利要求2所述的音频处理方法,其特征在于,所述循环神经网络包括第一门控循环层、第二门控循环层及第三门控循环层;所述将所述K个卷积特征向量作为循环神经网络的输入,通过所述循环神经网络输出K
个循环特征向量,包括:获取第四卷积特征向量,其中,所述第四卷积特征向量为K个卷积特征向量中任意的卷积特征向量;将所述第四卷积特征向量作为第一门控循环层的输入,通过所述第一门控循环层输出第四循环特征向量;将所述第四循环特征向量作为所述第二门控循环层的输入,通过所述第二门控循环层输出第五循环特征向量;将所述第五循环特征向量作为所述第三门控循环层的输入,通过所述第三层的第六循环特征向量。5.如权利要求2所述的...
【专利技术属性】
技术研发人员:梁俊斌,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。