音频处理方法、装置、计算设备及介质制造方法及图纸

技术编号:36686989 阅读:14 留言:0更新日期:2023-02-27 19:50
本公开提供了一种音频处理方法、装置、计算设备及介质。通过响应于针对待处理音频序列的音量调整操作,基于待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息,确定目标音频调整信息,以便基于目标音频调整信息实现音频处理。由于当前能量分布信息对应的是用户正在收听的音频帧,而历史能量分布信息对应的是用户过往收听过的音频帧,这些都是已经被用户所感知、接受并认可的,从而使得通过当前能量分布信息和历史能量分布信息确定出目标音频调整信息,并基于目标音频调整信息来实现对音频序列的调整,是可以满足用户的个性化听音需求的,进而使得本公开所提供的方案可以为用户提供自适应的个性化音频调整方式。整方式。整方式。

【技术实现步骤摘要】
音频处理方法、装置、计算设备及介质


[0001]本公开的实施方式涉及多媒体数据处理
,更具体地,本公开的实施方式涉及一种音频处理方法、装置、计算设备及介质。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着计算机技术和网络传输技术的不断发展,线上会议、线上教育、互动娱乐等多种类型的应用层出不穷,而为了获得沉浸式的音频收听体验,越来越多的用户倾向于使用耳机进行音频的收听。
[0004]但是,由于不同用户之间听音舒适度和倾向的差异,会导致不同用户对于耳机下行听音音量大小和音色的需要不同,因此,亟需一种音频处理方法,以为用户提供自适应和个性化的音频调整方式。

技术实现思路

[0005]鉴于相关技术中不同用户对于耳机下行听音音量大小和音色的需要不同的情况,本公开的实施方式至少提供一种音频处理方法、装置、计算设备及介质。
[0006]在本公开实施方式的第一方面中,提供了一种音频处理方法,该方法包括:
[0007]响应于针对待处理音频序列的音量调整操作,获取待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息,目标音频帧为经过音量调整的音频帧中位于预设帧数处的音频帧,当前能量分布信息用于指示目标音频帧在多个频域子带上的能量值,历史能量分布信息用于指示目标音频帧的前一个音频帧在多个频域子带上的能量值;
[0008]基于目标音频帧对应的当前能量分布信息和历史能量分布信息,确定目标音频调整信息,目标音频调整信息用于对位于目标音频帧之后的任一音频帧在多个频点上的能量值进行调整;
[0009]基于目标音频调整信息,对待处理音频序列中位于目标音频帧之后的每个音频帧在多个频点上的能量值进行调整。
[0010]在本公开的一个实施例中,基于目标音频帧对应的当前能量分布信息和历史能量分布信息,确定目标音频调整信息,包括:
[0011]基于当前能量分布信息以及历史能量分布信息,确定第一能量分布差异信息,第一能量分布差异信息用于指示当前能量分布信息和历史能量分布信息在多个频域子带上的能量差值;
[0012]基于历史音频调整信息和第一能量分布差异信息,确定目标音频调整信息,历史音频调整信息为响应于上一次针对待处理音频序列的音量调整操作所确定出的音频调整信息。
[0013]在本公开的一个实施例中,基于历史音频调整信息和第一能量分布差异信息,确
定目标音频调整信息,包括:
[0014]以第一设定参数对第一能量分布差异信息进行加权处理,并基于加权后的第一能量分布差异信息,以及历史音频调整信息,确定目标音频调整信息。
[0015]在本公开的一个实施例中,以第一设定参数对第一能量分布差异信息进行加权处理,并基于加权后的第一能量分布差异信息,以及历史音频调整信息,确定目标音频调整信息,包括:
[0016]以第一设定参数作为第一能量分布差异信息的权重,对第一能量分布差异信息进行加权处理,得到加权后的第一能量分布信息;
[0017]确定加权后的第一能量分布信息和历史音频调整信息的和值,作为目标音频调整信息。
[0018]在本公开的一个实施例中,响应于针对待处理音频序列的音量调整操作,获取待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息之前,该方法还包括:
[0019]每接收到待处理音频序列中的一个音频帧,则确定音频帧在每个频域子带上的能量值以及音频帧的总体能量值;
[0020]在所接收到的音频帧的总体能量值大于设定能量阈值的情况下,基于音频帧对应的历史能量分布信息和音频帧在多个频域子带上的能量值,确定音频帧的当前能量分布信息。
[0021]在本公开的一个实施例中,确定音频帧在每个频域子带上的能量值以及音频帧的总体能量值,包括:
[0022]确定音频帧在每个频域子带上的信号能量值;
[0023]对音频帧在各个频域子带上的信号能量值进行求和,得到音频帧的总体能量值。
[0024]在本公开的一个实施例中,基于音频帧对应的历史能量分布信息和音频帧在多个频域子带上的能量值,确定音频帧的当前能量分布信息,包括:
[0025]以第二设定参数分别对音频帧在多个频域子带上的能量值与历史能量分布信息所指示的对应频域子带上的能量值进行加权处理,并基于加权处理所得到的结果确定第一能量分布信息;
[0026]基于第一能量分布信息所指示的多个频域子带上的能量值以及第一能量分布信息所指示的多个频域子带上的能量值之和,确定当前能量分布信息;
[0027]其中,第二设定参数基于待处理音频序列的采样率和预设时长确定,预设时长为用于对待处理音频序列中每个音频帧的频谱进行平滑处理所需的时长。
[0028]在本公开的一个实施例中,以第二设定参数分别对音频帧在多个频域子带上的能量值与历史能量分布信息所指示的对应频域子带上的能量值进行加权处理,并基于加权处理所得到的结果确定第一能量分布信息,包括:
[0029]以第二设定参数作为音频帧在多个频域子带上的能量值的权重,对音频帧在多个频域子带上的能量值进行加权处理,以设定参数值与第二设定参数的差值作为历史能量分布信息的权重,对历史能量分布信息进行加权处理;
[0030]确定两次加权处理所得到的结果的和值,作为第一能量分布信息。
[0031]在本公开的一个实施例中,响应于针对待处理音频序列的音量调整操作,获取待
处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息,包括:
[0032]响应于针对待处理音频序列的音量调整操作,在接收到的音频帧的总体能量值大于设定能量阈值的情况下,执行基于音频帧对应的历史能量分布信息和音频帧在多个频域子带上的能量值,确定音频帧的当前能量分布信息的步骤;
[0033]在接收到目标音频帧且已确定出目标音频帧的当前能量分布信息的情况下,执行获取待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息的步骤。
[0034]在本公开的一个实施例中,在所接收到的音频帧的总体能量值大于设定能量阈值的情况下,基于音频帧对应的历史能量分布信息和音频帧在多个频域子带上的能量值,确定音频帧的当前能量分布信息之前,该方法还包括:
[0035]在未检测到针对待处理音频序列的音量调整操作的情况下,将历史音频调整信息确定为目标音频调整信息。
[0036]在本公开的一个实施例中,在未对待处理音频序列进行音量调整操作的情况下,将多个频域子带对应取值均为1的向量曲线作为历史音频调整信息。
[0037]在本公开的一个实施例中,该方法还包括:
[0038]获取目标音频帧的噪声能量值,噪声能量值由待处理音频序列的发送端基于目标音频帧确定得到;
[0039]响应于针对待处理音频序列的音量调整操作,获取待处理音频序列中目标音频帧对应的当前能量分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:响应于针对待处理音频序列的音量调整操作,获取所述待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息,所述目标音频帧为经过音量调整的音频帧中位于预设帧数处的音频帧,所述当前能量分布信息用于指示所述目标音频帧在多个频域子带上的能量值,所述历史能量分布信息用于指示所述目标音频帧的前一个音频帧在多个频域子带上的能量值;基于所述目标音频帧对应的当前能量分布信息和历史能量分布信息,确定目标音频调整信息,所述目标音频调整信息用于对位于所述目标音频帧之后的任一音频帧在多个频点上的能量值进行调整;基于所述目标音频调整信息,对所述待处理音频序列中位于目标音频帧之后的每个音频帧在多个频点上的能量值进行调整。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标音频帧对应的当前能量分布信息和历史能量分布信息,确定目标音频调整信息,包括:基于所述当前能量分布信息以及所述历史能量分布信息,确定第一能量分布差异信息,所述第一能量分布差异信息用于指示所述当前能量分布信息和所述历史能量分布信息在多个频域子带上的能量差值;基于历史音频调整信息和所述第一能量分布差异信息,确定所述目标音频调整信息,所述历史音频调整信息为响应于上一次针对所述待处理音频序列的音量调整操作所确定出的音频调整信息。3.根据权利要求2所述的方法,其特征在于,所述基于历史音频调整信息和所述第一能量分布差异信息,确定所述目标音频调整信息,包括:以第一设定参数对所述第一能量分布差异信息进行加权处理,并基于加权后的第一能量分布差异信息,以及所述历史音频调整信息,确定所述目标音频调整信息。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述目标音频帧的噪声能量值,所述噪声能量值由所述待处理音频序列的发送端基于所述目标音频帧确定得到;所述响应于针对待处理音频序列的音量调整操作,获取所述待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息之前,所述方法还包括:在系统音量等级未达到最大音量等级,且所述噪声能量值不大于第一能量阈值的情况下,执行响应于针对待处理音频序列的音量调整操作,获取所述待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息的步骤。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在所述系统音量等级未达到最大音量等级,且所述噪声能量值大于第一能量阈值小于第二能量阈值的情况下,基于所述目标音频帧的当前能量分布信息以及所述目标音频帧所包括的噪声信号的噪声能量分布信息,确定第二能量分布差异信息,所述噪声能量分布信息用于指示所述噪声信号在多个频域子带上的能量值,所述第二能量分布差异信息用于指示所述能量分布信息和所述噪声能量分布信息在多个频域子带上的能量...

【专利技术属性】
技术研发人员:张龙陈功阮良陈耀斌
申请(专利权)人:杭州网易智企科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1