音频信号的处理方法、电子设备及可读存储介质技术

技术编号:38664932 阅读:14 留言:0更新日期:2023-09-02 22:46
本申请公开了一种音频信号的处理方法、电子设备及可读存储介质,属于终端技术领域。该方法包括:获取TWS耳机中目标耳机的麦克风拾取的第一初始音频信号,第一初始音频信号中包括通过目标耳机的前馈麦克风采集的第一前馈音频信号和通过目标耳机的主麦克风采集的第一主音频信号,目标耳机为TWS耳机中任意一边的耳机;基于第一初始音频信号和第一前馈音频信号,通过一阶差分波束算法确定第一前馈音频信号对应的第一幅值增益函数;将第一幅值增益函数作用于第一主音频信号中,得到人声抑制后的第一目标音频信号。本申请通过一阶差分波束算法对自讲人声进行抑制,从而改善了自讲人声突兀的问题,提高了后续音频播放效果。提高了后续音频播放效果。提高了后续音频播放效果。

【技术实现步骤摘要】
音频信号的处理方法、电子设备及可读存储介质


[0001]本申请涉及终端
,特别涉及一种音频信号的处理方法、电子设备及可读存储介质。

技术介绍

[0002]随着蓝牙技术的发展,人们对真无线立体声(True Wireless Stereo,TWS)耳机的使用越来普遍。由于TWS耳机的拾音能力强于诸如手机、平板电脑等电子设备本身的拾音能力,且通过TWS耳机的麦克风能够获得更加清晰的人声,因此,用户通常会佩戴TWS耳机,并在TWS耳机与手机或者平板电脑等电子设备蓝牙连接后,通过TWS耳机和电子设备进行录音录像的操作,后续即可进行音频的播放。
[0003]但是,在通过TWS耳机进行录音的情况下,受限于录音环境和硬件设备,在播放音频时,往往存在自讲人声突兀的问题,导致自讲人声与环境声音不和谐,降低了音频播放的效果。

技术实现思路

[0004]本申请提供了一种音频信号的处理方法、电子设备及可读存储介质,可以改善自讲人声比较突兀的问题,以提高音频播放的效果。所述技术方案如下:
[0005]第一方面,提供了一种音频信号的处理方法,所述方法包括:
[0006]获取真无线立体声TWS耳机中目标耳机的麦克风拾取的第一初始音频信号,所述第一初始音频信号中包括通过所述目标耳机的前馈麦克风采集的第一前馈音频信号和通过所述目标耳机的主麦克风采集的第一主音频信号,所述目标耳机为所述TWS耳机中任意一边的耳机;
[0007]基于所述第一初始音频信号和所述第一前馈音频信号,通过一阶差分波束算法确定所述第一前馈音频信号对应的第一幅值增益函数,所述第一幅值增益函数用于描述所述第一前馈音频信号中每个频点的幅值增益;
[0008]将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号。
[0009]如此,由于一阶差分波束会对180度方向的振幅进行抑制,因此,通过一阶差分波束算法确定第一幅值增益函数,并将该第一幅值增益函数作用在第一主音频信号中的情况下,该第一主音频信号位于180度方向的音频信号的振幅将会被抑制。而由于TWS耳机佩戴方式使得采集的佩戴者的自讲音频信号集中在180度的方向,因此,对第一主音频信号位于180度方向的音频信号的振幅进行抑制,即为对佩戴者自讲人声的抑制,从而改善了自讲人声突兀的问题,提高了后续音频播放效果。
[0010]作为本申请的一个示例,所述基于所述第一初始音频信号和所述第一前馈音频信号,通过一阶差分波束算法确定所述第一前馈音频信号对应的第一幅值增益函数,包括:
[0011]对所述第一初始音频信号进行频域转换处理,得到第一初始频域信号;
[0012]确定所述第一初始频域信号中处于预设频段的频点对应的差分波束系数;
[0013]将所述差分波束系数与所述第一初始频域信号相乘,得到所述预设频段对应的差分波束信号;
[0014]基于所述差分波束信号中每个频点的幅值和第一前馈频域信号中处于所述预设频段的每个频点的幅值,确定所述第一前馈频域信号在所述预设频段对应的第二幅值增益函数,所述第一前馈频域信号为所述第一前馈音频信号对应的频域信号;
[0015]基于所述第二幅值增益函数和所述第一前馈频域信号,确定所述第一幅值增益函数。
[0016]如此,由于语音主要集中在中低频,即语音的频率通常在5kHz以下,且差分波束的信号的波束图在中低频段较为稳定,因此,通过设置预设频段,并确定第一幅值增益函数,能够通过第一幅值增益函数定向进行振幅抑制,从而提高了对自讲人声抑制的准确性。
[0017]作为本申请的一个示例,所述基于所述第二幅值增益函数和所述第一前馈频域信号,确定所述第一幅值增益函数,包括:
[0018]确定所述第二幅值增益函数中所有频点的平均幅值增益;
[0019]将所述平均幅值增益确定为所述第一前馈频域信号中除所述预设频段之外的其他频段的每个频点的幅值增益;
[0020]根据所述其他频段的每个频点的幅值增益,构建第三幅值增益函数;
[0021]基于所述第三幅值增益函数和所述第二幅值增益函数,确定所述第一幅值增益函数。
[0022]如此,通过第二幅值增益函数确定第三幅值增益函数,也即是,将预设频段的幅值增益扩展至其他频段,从而使得各类声音的幅值增益较为均衡。
[0023]作为本申请的一个示例,所述将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号之前,还包括:
[0024]通过预设分段函数对所述第一幅值增益函数进行修正;
[0025]所述将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号,包括:
[0026]将修正后的所述第一幅值增益函数与第一主频域信号相乘,得到第一目标频域信号,所述第一主频域信号为所述第一主音频信号对应的频域信号;
[0027]将所述第一目标频域信号进行时域转换处理,得到所述第一目标音频信号。
[0028]如此,通过对第一幅值增益函数进行修正,从而使得在180度方向外其他方向采集的音频信号的幅值增益尽可能的接近1,即实现了在进行自讲人声抑制的过程中,降低了对180度方向外其他方向采集的音频信号带来的影响。
[0029]作为本申请的一个示例,所述将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号之后,还包括:
[0030]对第一立体声信号依次进行降噪处理和滤波处理,得到第二立体声信号,所述第一立体声信号中包括所述第一目标音频信号和第二目标音频信号,所述第二目标音频信号为对所述TWS耳机中除所述目标耳机之外其他耳机的麦克风采集得到第二初始音频信号进行人声抑制处理后得到;
[0031]获取所述第一目标音频信号和所述第二目标音频信号之间的时间差;
[0032]基于所述时间差,对所述第一目标音频信号和所述第二目标音频信号进行时延对齐;
[0033]通过双耳房间脉冲响应(Binaural Room Impulse Response,BRIR)信号对第三立体声信号进行渲染,得到第四立体声信号,所述BRIR信号是在得到所述第二立体声信号后基于所述第二立体声信号的声场方向确定,所述第三立体声信号包括时延对齐后的所述第一目标音频信号和所述第二目标音频信号。
[0034]如此,通过对第一立体声信号进行降噪处理,从而保证了得到的第二立体声信号的保真度。另外,通过BRIR信号对第三立体声信号进行渲染,从而使得到的第四立体声信号播放过程中具有良好的距离感和方位感。
[0035]作为本申请的一个示例,所述BRIR信号包括所述第一目标音频信号对应的第一BRIR信号和所述第二目标音频信号对应的第二BRIR信号;
[0036]所述通过双耳房间脉冲响应BRIR信号对第三立体声信号进行渲染,得到第四立体声信号,包括:
[0037]将时延对齐后的所述第一目标音频信号与所述第一BRIR信号中第一响应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信号的处理方法,其特征在于,所述方法包括:获取真无线立体声TWS耳机中目标耳机的麦克风拾取的第一初始音频信号,所述第一初始音频信号中包括通过所述目标耳机的前馈麦克风采集的第一前馈音频信号和通过所述目标耳机的主麦克风采集的第一主音频信号,所述目标耳机为所述TWS耳机中任意一边的耳机;基于所述第一初始音频信号和所述第一前馈音频信号,通过一阶差分波束算法确定所述第一前馈音频信号对应的第一幅值增益函数,所述第一幅值增益函数用于描述所述第一前馈音频信号中每个频点的幅值增益;将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号。2.如权利要求1所述的方法,其特征在于,所述基于所述第一初始音频信号和所述第一前馈音频信号,通过一阶差分波束算法确定所述第一前馈音频信号对应的第一幅值增益函数,包括:对所述第一初始音频信号进行频域转换处理,得到第一初始频域信号;确定所述第一初始频域信号中处于预设频段的频点对应的差分波束系数;将所述差分波束系数与所述第一初始频域信号相乘,得到所述预设频段对应的差分波束信号;基于所述差分波束信号中每个频点的幅值和第一前馈频域信号中处于所述预设频段的每个频点的幅值,确定所述第一前馈频域信号在所述预设频段对应的第二幅值增益函数,所述第一前馈频域信号为所述第一前馈音频信号对应的频域信号;基于所述第二幅值增益函数和所述第一前馈频域信号,确定所述第一幅值增益函数。3.如权利要求2所述的方法,其特征在于,所述基于所述第二幅值增益函数和所述第一前馈频域信号,确定所述第一幅值增益函数,包括:确定所述第二幅值增益函数中所有频点的平均幅值增益;将所述平均幅值增益确定为所述第一前馈频域信号中除所述预设频段之外的其他频段的每个频点的幅值增益;根据所述其他频段的每个频点的幅值增益,构建第三幅值增益函数;基于所述第三幅值增益函数和所述第二幅值增益函数,确定所述第一幅值增益函数。4.如权利要求2或3所述的方法,其特征在于,所述将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号之前,还包括:通过预设分段函数对所述第一幅值增益函数进行修正;所述将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号,包括:将修正后的所述第一幅值增益函数与第一主频域信号相乘,得到第一目标频域信号,所述第一主频域信号为所述第一主音频信号对应的频域信号;将所述第一目标频域信号进行时域转换处理,得到所述第一目标音频信号。5.如权利要求1

4中任一项所述的方法,其特征在于,所述将所述第一幅值增益函数作用于所述第一主音频信号中,得到人声抑制后的第一目标音频信号之后,还包括:对第一立体声信号依次进行降噪处理和滤波处理,得到第二立体声信号,所述第一立
体声信号中包括所述第一目标音频信号和第二目标音频信号,所述第二目标音频信号为对所述TWS耳机中除所述目标耳机之外其他耳机的麦克风采集得到第二初始音频信号进行人声抑制处理后得到;获取所述第一目标音频信号和所述第二目标音频信号之间的时间差;基于所述时间差,对所述第一目标音频信号和所述第二目标音频信号进行时延对齐;通过双耳房间脉冲响应BRIR信号对第三立体声信号进行渲染,得到第四立体声信号,所述BRIR信号是在得到所述...

【专利技术属性】
技术研发人员:宁岳刘镇亿
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1