【技术实现步骤摘要】
音频处理方法、装置、电子设备和存储介质
[0001]本申请属于音频信号处理领域,具体涉及一种音频处理方法、装置、电子设备和存储介质。
技术介绍
[0002]互联网技术的发展,使得群语音、群视频等群聊方式得以普及。然而在群聊场景下,一旦有成员的语音质量不佳,就会影响所有成员的通话体验。
[0003]例如在群聊场景下,不同成员的语音音量高低各异,但用户可操作的音量调节却是针对所有成员整体进行固定调整,例如针对所有成员的语音音量,固定将所有的成员的音量都调高5分贝,则会可能出现某个成员的语音音量本身已经比较高,还需进一步调高,而音量低的成员还需进一步调高才能听清的情况。
[0004]如此一来,用户无法通过终端实现群聊场景下音量的有效调节,直接影响了用户的通话体验。
技术实现思路
[0005]本申请实施例的目的是提供一种音频处理方法、装置、电子设备和存储介质,能够解决群聊场景下音量调节的有效性问题。
[0006]第一方面,本申请实施例提供了一种音频处理方法,该方法包括:
[0007]接 ...
【技术保护点】
【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:接收用户的第一输入;响应于所述第一输入,从K路第一音频中确定出待调整音量的第二音频,K为大于1的整数;对所述第二音频进行音量调整,得到第三音频;播放所述第三音频,以及所述K路第一音频中除所述第二音频外的第一音频。2.根据权利要求1所述的音频处理方法,其特征在于,所述响应于所述第一输入,从K路第一音频中确定出待调整音量的第二音频,包括:响应于所述第一输入,从所述K路第一音频中确定出标准音频,并将所述K路第一音频中除所述标准音频外的第一音频确定为所述第二音频;所述对所述第二音频进行音量调整,得到第三音频,包括:基于所述标准音频,对所述第二音频进行音量调整,得到所述第三音频。3.根据权利要求2所述的音频处理方法,其特征在于,所述基于所述标准音频,对所述第二音频进行音量调整,得到所述第三音频,包括:对各路第一音频进行音量包络估计,得到所述标准音频的标准音量包络,以及所述第二音频的第二音量包络;以所述标准音量包络为标准,对所述第二音量包络进行调整,得到所述第三音频。4.根据权利要求3所述的音频处理方法,其特征在于,所述对各路第一音频进行音量包络估计,包括:确定所述第一音频中各时刻的语音帧的模值;在所述各时刻中任一时刻的语音帧的模值小于等于所述任一时刻的前一时刻的包络值的情况下,基于衰减因子和所述前一时刻的包络值,确定所述任一时刻的包络值;在所述任一时刻的语音帧的模值大于所述前一时刻的包络值的情况下,将所述任一时刻的语音帧的模值确定为所述任一时刻的包络值。5.根据权利要求3所述的音频处理方法,其特征在于,所述以所述标准音量包络为标准,对所述第二音量包络进行调整,得到所述第三音频,包括:基于动态步长,以及所述标准音量包络中任一时刻的标准包络值,对所述第二音量包络中所述任一时刻的包络值进行调整;所述动态步长基于所述任一时刻的包络误差和所述第二音频的音量值中的至少一种确定;所述任一时刻的包络误差基于所述标准包络值和所述任一时刻调整后的包络值确定,或者,基于所述标准包络值、所述任一时刻调整后的包络值以及所述任一时刻的前一时刻的包络误差确定。6.根据权利要求5所述的音频处理方法,其特征在于,所述任一时刻的包络误差基于所述标准包络值、所述任一时刻调整后的包络值以及所述任一时刻的前一时刻的包络误差确定,包括:基于所述任一时刻的前一时刻的包络误差,以及,所述标准包络值和所述任一时刻调整后的包络值之间的误差,确定所述任一时刻的包络误差。7.根据权利要求1所述的音频处理方法,其特征在于,所述对所述第二音频进行音量调
整,得到第三音频,包括:响应于所述第一输入,显示音量调节界面;接收所述用户对所述音量调节界面的第二输入;响应于所述第二输入,确定参考音量参数;基于所述参考音量参数,对所述第二音频进行音量调整,得到第三音频。8.一种音频处理装置,其特征在于,包括:第一接收单元,用于接收用户的第一输入;音频确定单元,用于响应于所述第一输入,从...
【专利技术属性】
技术研发人员:程戈,
申请(专利权)人:维沃移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。