【技术实现步骤摘要】
音频处理方法、装置、计算机设备及存储介质
本申请实施例涉及音频处理
,特别涉及一种音频处理方法、装置、计算机设备及存储介质。
技术介绍
随着数字音乐技术的不断发展,用户对于音频或者视频的音质的要求也越来越高,这就需要音频播放产品(设备或者应用程序)能够提供更高采样率的音频数据。在相关技术中,为音乐播放提供支持的设备或者应用程序能够通过预设的音频数据算法,对低采样率的音频数据进行超分辨率处理,获得高分辨率的音频数据。比如,可以通过基于一维插值的音频数据上采样算法,或者,通过基于傅立叶变换的音频数据上采样算法对低采样率的音频数据进行上采样处理。由于低采样率的音频数据相对于原始音频而言,通常会缺失很多高频成分,而通过相关技术中的音频数据上采样算法无法对上述缺失的高频成分进行弥补,导致音频处理结果较差。
技术实现思路
本申请实施例提供了一种音频处理方法、装置、计算机设备及存储介质,可以提高对音频数据的超分辨率处理结果,技术方案如下:一方面,提供了一种音频处理方法,所述方法包括: >获取第一音频数据,本文档来自技高网...
【技术保护点】
1.一种音频处理方法,其特征在于,所述方法包括:/n获取第一音频数据,所述第一音频数据的采样率为第一采样率;/n通过超分辨率模型对所述第一音频数据进行处理,获得所述超分辨率模型的输出结果;所述超分辨率模型是以第一音频样本为输入数据,以第二音频样本为目标数据进行深度学习训练获得的机器学习模型;所述第一音频样本是通过对所述第二音频样本进行N倍降采样获得的,N为大于或者等于2的整数;/n根据所述超分辨率模型的输出结果获得第二音频数据,所述第二音频数据的采样率为第二采样率;所述第二采样率是所述第一采样率的N倍。/n
【技术特征摘要】 【专利技术属性】
1.一种音频处理方法,其特征在于,所述方法包括:
获取第一音频数据,所述第一音频数据的采样率为第一采样率;
通过超分辨率模型对所述第一音频数据进行处理,获得所述超分辨率模型的输出结果;所述超分辨率模型是以第一音频样本为输入数据,以第二音频样本为目标数据进行深度学习训练获得的机器学习模型;所述第一音频样本是通过对所述第二音频样本进行N倍降采样获得的,N为大于或者等于2的整数;
根据所述超分辨率模型的输出结果获得第二音频数据,所述第二音频数据的采样率为第二采样率;所述第二采样率是所述第一采样率的N倍。
2.根据权利要求1所述的方法,其特征在于,所述第一音频数据是对应R个音轨的音频数据,R为大于或者等于1的整数;
所述通过超分辨率模型对所述第一音频数据进行处理,获得所述超分辨率模型的输出结果,包括:
将所述第一音频数据分为R个第一单音轨音频数据;所述第一单音轨音频数据的采样率为所述第一采样率;
通过所述超分辨率模型对所述R个第一单音轨音频数据分别进行处理,获得所述R个第一单音轨音频数据分别对应的第二单音轨音频数据;所述第二单音轨音频数据的采样率为所述第二采样率;
所述根据所述超分辨率模型的输出结果获得第二音频数据,包括:
将所述R个第一单音轨音频数据分别对应的第二单音轨音频数据进行音轨合成,获得所述第二音频数据。
3.根据权利要求2所述的方法,其特征在于,所述超分辨率模型包括输入层、特征提取层、上采样层和输出层;
所述通过所述超分辨率模型对所述R个第一单音轨音频数据分别进行处理,获得所述R个第一单音轨音频数据分别对应的第二单音轨音频数据,包括:
通过所述输入层,将目标单音轨音频数据中长度为M/N的音频数据序列组织为输入数据单元,所述输入数据单元的尺寸为M/N×1×1,M/N是大于或者等于2的整数;所述目标单音轨音频数据是所述R个第一单音轨音频数据中的任意一个单音轨音频数据;
通过所述特征提取层,对所述输入数据单元进行特征提取,获得尺寸为M/N×1×S的特征数据单元,S为所述特征数据单元的通道数,且S为大于或者等于2的整数;
通过所述上采样层,对所述特征数据单元进行N倍上采样,获得尺寸为M×1×1的上采样数据单元;
通过所述输出层,根据所述上采样数据单元输出所述目标单音轨音频数据对应的第二单音轨音频数据中,长度为M的音频数据序列。
4.根据权利要求3所述的方法,其特征在于,所述上采样层包括第一卷积层和数据重排层;
所述通过所述上采样层,对所述特征数据单元进行N倍上采样,获得尺寸为M×1×1的上采样数据单元,包括:
通过所述第一卷积层的卷积处理,将所述特征数据单元转化为待采样数据单元,所述待采样数据单元的尺寸为M/N×1×N;
通过所述数据重排层,将所述待采样数据单元的第一个维度和第二个维度的数据交换,并对数据交换后的所述待采样数据单元进行维度变换,获得所述上采样数据单元。
5.根据权利要求1所述的方法,其特征在于,所述通过超分辨率模型对所述第一音频数据进行处理,获得所述超分辨率模型的输出结果之前,还包括:
获取与所述第一采样率和所述第二采样率相对应的所述超分辨率模型;
其中,所述第一音频样本的采样率为所述第一采样率,所述第二音频样本的采样率为所述第二采样率。
6.根据权利要求1所述的方法,其特征在于,所述通过超分辨率模型对所述第一音频数据进行处理,获得所述超分辨率模型的输出结果之前,还包括:
获取与超分辨率倍数相对应的所述超分辨率模型;所述超分辨率倍数是所述第二采样率相对于所述第一采样率的倍数N;
其中,所述第一采样率与所述第二音频采样率之间的倍数关系,等于所述第一音频样本的采样率与所述第二音频样本的采样率之间的倍数关系。
7.根据权利要求1至6任一所述的方法,其特征在于,所述第一音频样本和所述第二音频样本分别是单音轨音频数据;
技术研发人员:陈法圣,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。