音频处理方法及装置制造方法及图纸

技术编号:32830698 阅读:11 留言:0更新日期:2022-03-26 20:42
本公开关于一种音频处理方法及装置。音频处理方法包括:基于录制的音频对应的原始音频的调性信息和调式信息,获取原始音频对应的音阶的音高;针对录制的音频中的人声信号的每个信号帧,执行以下操作:基于原始音频对应的音阶的音高,确定当前信号帧的参考音高;基于当前信号帧的参考音高,对当前信号帧对应的音高进行调整,得到当前信号帧的目标音高;基于目标音高,处理当前信号帧。处理当前信号帧。处理当前信号帧。

【技术实现步骤摘要】
音频处理方法及装置


[0001]本公开涉及音视频处理领域,尤其涉及一种音频处理方法及装置。

技术介绍

[0002]修音主要指通过对采集的音频中人声进行音高的修正,使得处理后的人声相比处理前的人声音高更加准确,同时还可以掩蔽掉一部分演唱瑕疵如破音、气息不稳、跑调。通常为了获得准确的人声音高,混音师们可以通过一些音频插件如wave

tune、Melodyne手动修正人声音高来达到上述目的,然而手动调整费时费力,无法对人声进行批量处理,因此自动修音成为音频工作者们关注的问题。
[0003]目前自动修音强烈依赖midi参考信息,但是,并不是每个录制的音频都有对应的midi参考信息,如改编的歌曲并没有对应的midi参考信息,此时,如果采用原始歌曲的midi参考信息,很难得到准确的修音结果。

技术实现思路

[0004]本公开提供一种音频处理方法及装置,以至少解决相关技术修音不准确的问题。
[0005]根据本公开实施例的第一方面,提供一种音频处理方法,包括:基于录制的音频对应的原始音频的调性信息和调式信息,获取原始音频对应的音阶的音高;针对录制的音频中的人声信号的每个信号帧,执行以下操作:基于原始音频对应的音阶的音高,确定当前信号帧的参考音高;基于当前信号帧的参考音高,对当前信号帧对应的音高进行调整,得到当前信号帧的目标音高;基于目标音高,处理当前信号帧。
[0006]可选地,基于原始音频对应的音阶的音高,确定当前信号帧的参考音高,包括:将原始音频对应的音阶的音高中与当前信号帧的音高的差值绝对值最小的音高,作为当前信号帧的参考音高。
[0007]可选地,基于当前信号帧的参考音高,对当前信号帧对应的音高进行调整,得到当前信号帧的目标音高,包括:获取当前信号帧对应的音高与参考音高的差值;在差值超过预定范围的情况下,将当前信号帧对应的音高调整为与参考音高成预定比例;将调整后的音高作为当前信号帧的目标音高。
[0008]可选地,基于目标音高,处理当前信号帧,包括:获取录制的音频中的人声信号的每个信号帧的目标音高对应的目标频率集;对目标频率集进行平滑处理;获取当前信号帧的音高的频率;将频率调整为平滑处理后的目标频率集中当前信号帧的目标音高对应的目标频率。
[0009]可选地,将频率调整为平滑处理后的目标频率集中当前信号帧的目标音高对应的目标频率,包括:获取频率与平滑处理后的目标频率集中当前信号帧的目标音高对应的目标频率的比值;将比值输入到相位声码器或基音同步叠加单元中,将频率调整为平滑处理后的目标频率集中当前信号帧的目标音高对应的目标频率。
[0010]可选地,人声信号的每个信号帧对应的音高是通过下述操作得到的:通过语音端
点检测获取录制的音频中的人声信号;基于人声信号中的每个信号帧的基频,得到人声信号的每个信号帧对应的音高。
[0011]根据本公开实施例的第二方面,提供一种音频处理装置,包括:音高获取单元,被配置为基于录制的音频对应的原始音频的调性信息和调式信息,获取原始音频对应的音阶的音高;处理单元,被配置为针对录制的音频中的人声信号的每个信号帧,执行以下操作:基于原始音频对应的音阶的音高,确定当前信号帧的参考音高;基于当前信号帧的参考音高,对当前信号帧对应的音高进行调整,得到当前信号帧的目标音高;基于目标音高,处理当前信号帧。
[0012]可选地,处理单元,还被配置为将原始音频对应的音阶的音高中与当前信号帧的音高的差值绝对值最小的音高,作为当前信号帧的参考音高。
[0013]可选地,处理单元,还被配置为获取当前信号帧对应的音高与参考音高的差值;在差值超过预定范围的情况下,将当前信号帧对应的音高调整为与参考音高成预定比例;将调整后的音高作为当前信号帧的目标音高。
[0014]可选地,处理单元,还被配置为获取录制的音频中的人声信号的每个信号帧的目标音高对应的目标频率集;对目标频率集进行平滑处理;获取当前信号帧的音高的频率;将频率调整为平滑处理后的目标频率集中当前信号帧的目标音高对应的目标频率。
[0015]可选地,处理单元,还被配置为获取频率与平滑处理后的目标频率集中当前信号帧的目标音高对应的目标频率的比值;将比值输入到相位声码器或基音同步叠加单元中,将频率调整为平滑处理后的目标频率集中当前信号帧的目标音高对应的目标频率。
[0016]可选地,人声信号的每个信号帧对应的音高是通过下述操作得到的:通过语音端点检测获取录制的音频中的人声信号;基于人声信号中的每个信号帧的基频,得到人声信号的每个信号帧对应的音高。
[0017]根据本公开实施例的第三方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现根据本公开的音频处理方法。
[0018]根据本公开实施例的第四方面,提供了一种计算机可读存储介质,当计算机可读存储介质中的指令被至少一个处理器运行时,促使至少一个处理器执行如上根据本公开的音频处理方法。
[0019]根据本公开实施例的第五方面,提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现根据本公开的音频处理方法。
[0020]本公开的实施例提供的技术方案至少带来以下有益效果:
[0021]根据本公开的音频处理方法及装置,基于录制的音频对应的原始音频的调性信息和调式信息,获取所述原始音频对应的音阶的音高,然后基于原始音频对应的音阶的音高确定的参考音高结合录制的音频的人声信号的音高,来获取用于修正人声信号的目标音高,使得不再将音频对应的音乐的midi音高作为修正音频的目标音高,从而可以得到与音频匹配度好的目标音高,使得可以根据准确的目标音高修正录制的音频,以得到准确的修音结果。因此,本公开解决了相关技术修音不准确的问题。
[0022]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0023]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
[0024]图1是示出根据本公开的示例性实施例的音频处理方法的实施场景示意图;
[0025]图2是根据一示例性实施例示出的一种音频处理方法的系统架构图;
[0026]图3是根据一示例性实施例示出的一种音频处理方法的流程图;
[0027]图4是根据一示例性实施例示出的一种压缩过程示意图;
[0028]图5是根据一示例性实施例示出的一种相位声码器的流程图;
[0029]图6是根据一示例性实施例示出的一种音频处理装置的框图;
[0030]图7是根据本公开实施例的一种电子设备700的框图。
具体实施方式
[0031]为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
[0032]需要说明的是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:基于录制的音频对应的原始音频的调性信息和调式信息,获取所述原始音频对应的音阶的音高;针对所述录制的音频中的人声信号的每个信号帧,执行以下操作:基于所述原始音频对应的音阶的音高,确定当前信号帧的参考音高;基于所述当前信号帧的参考音高,对所述当前信号帧对应的音高进行调整,得到所述当前信号帧的目标音高;基于所述目标音高,处理所述当前信号帧。2.如权利要求1所述的音频处理方法,其特征在于,所述基于所述原始音频对应的音阶的音高,确定当前信号帧的参考音高,包括:将所述原始音频对应的音阶的音高中与所述当前信号帧的音高的差值绝对值最小的音高,作为所述当前信号帧的参考音高。3.如权利要求1所述的音频处理方法,其特征在于,所述基于所述当前信号帧的参考音高,对所述当前信号帧对应的音高进行调整,得到所述当前信号帧的目标音高,包括:获取所述当前信号帧对应的音高与所述参考音高的差值;在所述差值超过预定范围的情况下,将所述当前信号帧对应的音高调整为与所述参考音高成预定比例;将调整后的音高作为所述当前信号帧的目标音高。4.如权利要求1所述的音频处理方法,其特征在于,所述基于所述目标音高,处理所述当前信号帧,包括:获取所述录制的音频中的人声信号的每个信号帧的目标音高对应的目标频率集;对所述目标频率集进行平滑处理;获取所述当前信号帧的音高的频率;将所述频率调整为平滑处理后的目标频率集中所述当前信号帧的目标音高对应的目标频率。5.如权利要求4所述的音频处理方法,其特征在于,所述将所述频率调整为平滑处理后的目标频率集中所述当前信号帧的目标音高对应的...

【专利技术属性】
技术研发人员:范欣悦李子涵郑羲光张晨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1