齿音处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37721858 阅读:12 留言:0更新日期:2023-06-02 00:21
本申请提供了一种齿音处理方法、装置、电子设备及存储介质。该方法包括获取当前音频帧;确定当前音频帧的目标特征值;响应于当前音频帧的目标特征值满足预设条件,确定当前音频帧属于齿音的齿音帧,并确定齿音的调节参数,基于齿音的调节参数对当前音频帧进行齿音调节处理,从而可以逐帧对齿音进行齿音的检测以及调节处理,提高了齿音调节处理的实时性,不仅可以用于对实时性要求不高的录播场景中,还可以用于对实时性要求较高的实时场景中,实时地进行齿音调节处理。时地进行齿音调节处理。时地进行齿音调节处理。

【技术实现步骤摘要】
齿音处理方法、装置、电子设备及存储介质


[0001]本申请涉及音频处理
,具体涉及一种齿音处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]齿音(ess/sibilance)是指人发出的一切咝擦声,对应于较高的锐度,一般不适宜人耳收听。对于音频采集软件(如,唱歌软件)而言,通常会在获取到的音频数据之后对音频数据中的齿音进行处理,使得音频数据中每帧数据都处于合适的锐度范围内,避免较高锐度的齿音对人耳的听力造成损伤。
[0003]但是,相关技术中齿音处理方法的实时性较差。

技术实现思路

[0004]本申请实施例提供一种齿音处理方法、装置、电子设备及存储介质,以提高齿音调节处理的实时性。
[0005]本申请实施例的一方面提供一种齿音处理方法,包括:获取当前音频帧;确定所述当前音频帧的目标特征值;响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理。
[0006]在一些实施例中,所述响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理,包括:响应于所述当前音频帧的上一帧为非齿音帧且所述当前音频帧的目标特征值大于或等于第一阈值,确定所述当前音频帧为所述齿音的第一个齿音帧,并将所述当前音频帧的调节参数作为所述齿音的调节参数;基于所述齿音的调节参数设置并开启齿音滤波器,以对所述当前音频帧进行齿音调节处理。
[0007]在一些实施例中,所述响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理,还包括:响应于所述当前音频帧的上一帧为所述齿音帧且当前音频帧的目标特征值大于或等于所述第一阈值,确定所述当前音频帧为所述齿音的除第一个齿音帧外的其余齿音帧,将所述齿音的调节参数保持为所述齿音的第一个齿音帧的调节参数;保持所述齿音滤波器的开启状态,以对所述当前音频帧进行齿音调节处理。
[0008]在一些实施例中,所述方法还包括:响应于所述当前音频帧的上一帧为所述齿音帧且所述当前音频帧的目标特征值小于所述第一阈值,确定所述当前音频帧为非齿音帧,并停止所述齿音滤波器。
[0009]在一些实施例中,所述方法还包括:响应于所述当前音频帧的上一帧为所述非齿音帧且所述当前音频帧的目标特征值小于所述第一阈值,确定所述当前音频帧为非齿音
帧,并保持所述齿音滤波器的停止状态。
[0010]在一些实施例中,所述确定所述当前音频帧的目标特征值,包括:获取所述当前音频帧的初始特征值;对所述初始特征值进行平滑处理,得到所述当前音频帧的目标特征值。
[0011]在一些实施例中,所述对所述初始特征值进行平滑处理,得到所述当前音频帧的目标特征值,包括:基于所述当前音频帧的帧长,确定用于进行平滑处理的音频帧的数量M;获取所述当前音频帧之前的M

1个音频帧的目标特征值;基于所述M

1个音频帧的目标特征值对所述当前音频帧的初始特征值进行平滑处理,得到所述当前音频帧的目标特征值。
[0012]在一些实施例中,所述方法还包括:基于所述当前音频帧的目标特征值,在显示界面显示所述目标特征值随时间变化的第一图像。
[0013]在一些实施例中,所述齿音的调节参数包括:齿音能量集中处的中心频率以及需要进行所述齿音调节处理的所述齿音的作用频带,所述方法还包括:确定所述当前音频帧的响度;基于所述响度确定所述当前音频帧的齿音能量集中处的中心频率以及所述当前音频帧的能量衰减到所述预设衰减比率时的作用带宽;基于所述作用带宽和所述能量集中处的中心频率,确定所述当前音频帧的作用频带。
[0014]在一些实施例中,所述方法还包括:基于所述当前音频帧的作用带宽以及所述当前音频帧的齿音能量集中处的中心频率,在显示界面显示所述齿音的作用带宽以及所述齿音的齿音能量集中处的中心频率。
[0015]在一些实施例中,所述齿音的调节参数还包括:所述齿音调节处理的响应时间以及所述齿音调节处理的最大衰减量,所述方法还包括:获取由显示界面输入的所述齿音调节处理的响应时间以及所述齿音调节处理的滤除比例;基于所述滤除比例以及预设齿音调节处理的触发阈值,确定所述齿音调节处理的最大衰减量。
[0016]在一些实施例中,所述确定所述当前音频帧的目标特征值,包括:响应于所述当前音频帧的帧能量大于第二阈值且所述当前音频帧的过零率大于第三阈值,确定所述当前音频帧的目标特征值。
[0017]在一些实施例中,所述目标特征值包括用于衡量声音尖锐程度的锐度。
[0018]在一些实施例中,所述获取当前音频帧,包括:通过实时音频采集设备采集所述当前音频帧。
[0019]本申请实施例的另一方面提供一种齿音处理装置,包括:获取单元,用于获取当前音频帧;确定单元,用于确定所述当前音频帧的目标特征值;处理单元,用于响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理。
[0020]在一些实施例中,所述处理单元在用于所述响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理时,还进一步用于:响应于所述当前音频帧的上一帧为非齿音帧且所述当前音频帧的目标特征值大于或等于第一阈值,确定所述当前音频帧为所述齿音的第一个齿音帧,并将所述当前音频帧的调节参数作为所述齿音的调节参数;基于所述齿音的调节参数设置并开启齿音滤波器,以对所述当前音频帧进行齿音调节处理。
[0021]在一些实施例中,所述处理单元在用于所述响应于所述当前音频帧的目标特征值
满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理时,还进一步用于:响应于所述当前音频帧的上一帧为所述齿音帧且当前音频帧的目标特征值大于或等于所述第一阈值,确定所述当前音频帧为所述齿音的除第一个齿音帧外的其余齿音帧,将所述齿音的调节参数保持为所述齿音的第一个齿音帧的调节参数;保持所述齿音滤波器的开启状态,以对所述当前音频帧进行齿音调节处理。
[0022]在一些实施例中,所述处理单元还用于响应于所述当前音频帧的上一帧为所述齿音帧且所述当前音频帧的目标特征值小于所述第一阈值,确定所述当前音频帧为非齿音帧,并停止所述齿音滤波器。
[0023]在一些实施例中,所述处理单元还用于响应于所述当前音频帧的上一帧为所述非齿音帧且所述当前音频帧的目标特征值小于所述第一阈值,确定所述当前音频帧为非齿音帧,并保持本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种齿音处理方法,其特征在于,包括:获取当前音频帧;确定所述当前音频帧的目标特征值;响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理。2.根据权利要求1所述的方法,其特征在于,所述响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理,包括:响应于所述当前音频帧的上一帧为非齿音帧且所述当前音频帧的目标特征值大于或等于第一阈值,确定所述当前音频帧为所述齿音的第一个齿音帧,并将所述当前音频帧的调节参数作为所述齿音的调节参数;基于所述齿音的调节参数设置并开启齿音滤波器,以对所述当前音频帧进行齿音调节处理。3.根据权利要求2所述的方法,其特征在于,所述响应于所述当前音频帧的目标特征值满足预设条件,确定所述当前音频帧属于齿音的齿音帧,并确定所述齿音的调节参数,基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理,还包括:响应于所述当前音频帧的上一帧为所述齿音帧且当前音频帧的目标特征值大于或等于所述第一阈值,确定所述当前音频帧为所述齿音的除第一个齿音帧外的其余齿音帧,将所述齿音的调节参数保持为所述齿音的第一个齿音帧的调节参数;保持所述齿音滤波器的开启状态,以对所述当前音频帧进行齿音调节处理。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应于所述当前音频帧的上一帧为所述齿音帧...

【专利技术属性】
技术研发人员:熊贝尔郑毅郑博刘华平
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1