音频数据处理方法和装置、通话方法、音频处理芯片、电子设备以及计算机可读存储介质制造方法及图纸

技术编号：33066664 阅读：10 留言：0更新日期：2022-04-15 09:57

本申请公开了一种音频数据处理方法和装置、通话方法、音频处理芯片、电子设备以及计算机可读存储介质。该方法包括：对第一音频数据和第二音频数据进行线性滤波处理，得到线性回声数据；根据第二音频数据与所述线性回声数据确定线性输出数据；根据第一音频数据和所述第二音频数据，确定第一状态数据和第二状态数据；根据第一状态数据和第二状态数据，确定权重因子，以对线性输出数据进行加权滤波处理，得到发送给第一通话方的第三音频数据。因此，本申请能够基于当前通话状态来进行加权滤波或者采取对应的抑制方案来进行处理，从而能够考虑不同通话状态下回声残余的成分特性来进行回声残余抑制处理，能够提高回声残余抑制效果，有效提高通话质量。有效提高通话质量。有效提高通话质量。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据处理方法和装置、通话方法、音频处理芯片、电子设备以及计算机可读存储介质

[0001]本申请涉及音频数据处理
，尤其涉及一种音频数据处理方法和装置、通话方法、音频处理芯片、电子设备以及计算机可读存储介质。

技术介绍

[0002]随着音频通话技术的应用场景越来越广泛，人们对通话质量的要求也越来越高。在通常的通话过程中，当通话的一方说出语音之后，由该一方的通话设备采集并传输到通话的另一方并且由该另一方的通话设备的语音播放装置播放出来，从而通话的另一方能够收听到。在该过程中，当通话的一方的语音音频在通话的另一方的通话设备的语音播放装置播放时，会在该另一方所在的空间中产生回音，即，所播放的语音音频被空间中的各种墙壁或物体的表面反射，并且进而在该另一方响应于通话的一方的语音而做出语音应答时，被该另一方的通话设备的语音采集装置采集到，从而被当做通话的另一方的语音而回传给通话的乙方。因此，通话一方会在说话的同时接收到自己的声音在传输到通话另一方被再次传回的音频声音，即，产生了通话回声，这样的通话回声严重影响了通话方的通话体验。
[0003]现有技术中，通常根据音频数据的时延估计结果以及线性滤波器的输出等信息，来估计回声残余的能量，从而对线性回声处理后的信号进行频谱增益调整。但是，现有的回声处理方案仅考虑了通话中音频数据中的回声的残余能量，但是随着音频通话技术的应用场景的日益多样化，不同场景和环境下回声会呈现不同的特点，因此使用统一的残余能量为基准来抑制回声，难以满足多变复杂的场景下人们对音频通话质量的要求。r/>
技术实现思路

[0004]本申请实施例提供一种音频数据处理方法和装置、通话方法、音频处理芯片、电子设备以及计算机可读存储介质，以解决现有技术中回声残余消除效果不佳的缺陷。
[0005]为达到上述目的，本申请实施例提供了一种音频数据处理方法，包括：
[0006]对第一通话方发送的第一音频数据和第二通话方采集到的第二音频数据进行线性滤波处理，得到线性回声数据，其中，所述第一通话方与所述第二通话方处于同一通话活动中；
[0007]根据第二通话方采集到的第二音频数据与所述线性回声数据确定线性输出数据；
[0008]根据所述第一音频数据和所述第二音频数据，确定用于标识在所述第一通话方与所述第二通话方之间进行的音频通话状态的第一状态数据和第二状态数据，其中，所述第一状态数据是所述第一音频数据与所述第二音频数据在各个子频带的相关系数的平均值，并且所述第一状态数据是所述线性回声数据与所述第二音频数据在各个子频带的比值的平均值；
[0009]根据所述第一状态数据和所述第二状态数据，确定与所述通话状态相关的权重因子，以对所述线性输出数据进行加权滤波处理，得到发送给所述第一通话方的第三音频数
据。
[0010]本申请实施例还提供了一种音频数据处理方法，包括：
[0011]对第一通话方发送的第一音频数据和第二通话方采集到的第二音频数据进行线性滤波处理，得到线性回声数据，其中，所述第一通话方与所述第二通话方处于同一通话活动中；
[0012]根据第二通话方采集到的第二音频数据与所述线性回声数据确定线性输出数据；
[0013]根据所述第一音频数据和所述第二音频数据，确定用于标识在所述第一通话方与所述第二通话方之间进行的音频通话状态的第一状态数据和第二状态数据，其中，所述第一状态数据是所述第一音频数据与所述第二音频数据在各个子频带的相关系数的平均值，并且所述第一状态数据是所述线性回声数据与所述第二音频数据在各个子频带的比值的平均值；
[0014]根据所述第一状态数据和所述第二状态数据，选择与所述第一状态数据和所述第二状态数据对应的信号降低幅度值；
[0015]根据所述信号降低幅度值对所述线性输出音频数据进行降低信号幅度的操作，得到发送给所述第一通话方的音频数据。
[0016]本申请实施例还提供了一种通话方法，包括：
[0017]接收第一音频数据；
[0018]播放所述第一音频数据；
[0019]执行音频采集处理以生成第二音频数据，其中，所述第二音频数据至少包括在播放所述第一音频数据时采集到的音频数据；
[0020]对所述第二音频数据进行线性滤波处理，得到线性回声数据；
[0021]根据所述第二音频数据与所述线性回声数据确定线性输出数据；
[0022]根据所述第一音频数据和所述第二音频数据，确定用于标识音频通话状态的第一状态数据和第二状态数据，其中，所述第一状态数据是所述第一音频数据与所述第二音频数据在各个子频带的相关系数的平均值，并且所述第一状态数据是所述线性回声数据与所述第二音频数据在各个子频带的比值的平均值；
[0023]根据所述第一状态数据和所述第二状态数据，确定与所述通话状态相关的权重因子，以对所述线性输出数据进行加权滤波处理，得到第三音频数据；
[0024]将所述第三音频数据输出给进行通话的通话方。
[0025]本申请实施例还提供了一种音频处理芯片，包括：
[0026]音频接收模块，用于接收第一音频数据；
[0027]音频输出，用于播放所述第一音频数据；
[0028]拾音模块，用于执行音频采集处理以生成第二音频数据，其中，所述第二音频数据至少包括在播放所述第一音频数据时由所述拾音模块采集到的音频数据；
[0029]滤波模块，用于对所述第二音频数据进行线性滤波处理，得到线性回声数据；
[0030]处理模块，用于根据所述第二音频数据与所述线性回声数据确定线性输出数据，根据所述第一音频数据和所述第二音频数据，确定用于标识音频通话状态的第一状态数据和第二状态数据，其中，所述第一状态数据是所述第一音频数据与所述第二音频数据在各个子频带的相关系数的平均值，并且所述第一状态数据是所述线性回声数据与所述第二音
频数据在各个子频带的比值的平均值；以及根据所述第一状态数据和所述第二状态数据，确定与所述通话状态相关的权重因子，
[0031]其中，所述滤波模块用于对所述线性输出数据进行加权滤波处理，得到第三音频数据，并且
[0032]所述音频输出模块用于将所述第三音频数据输出给进行通话的通话方。
[0033]本申请实施例还提供了一种音频数据处理装置，包括：
[0034]滤波模块，用于对第一通话方发送的第一音频数据和第二通话方采集到的第二音频数据进行线性滤波处理，得到线性回声数据，其中，所述第一通话方与所述第二通话方处于同一通话活动中；
[0035]线性输出模块，用于根据第二通话方采集到的第二音频数据与所述线性回声数据确定线性输出数据；
[0036]状态确定模块，用于根据所述第一音频数据和所述第二音频数据，确定用于标识在所述第一通话方与所述第二通话方之间进行的音频通话状态的第一状态数据和第二状态数据，其中，所述第一状态数据是所述第一音频数据与所述第二音频数据在各个子频带的相关系数的平均值，并且所述第一状本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频数据处理方法，包括：对第一通话方发送的第一音频数据和第二通话方采集到的第二音频数据进行线性滤波处理，得到线性回声数据，其中，所述第一通话方与所述第二通话方处于同一通话活动中；根据第二通话方采集到的第二音频数据与所述线性回声数据确定线性输出数据；根据所述第一音频数据和所述第二音频数据，确定用于标识在所述第一通话方与所述第二通话方之间进行的音频通话状态的第一状态数据和第二状态数据，其中，所述第一状态数据是所述第一音频数据与所述第二音频数据在各个子频带的相关系数的平均值，并且所述第二状态数据是所述线性回声数据与所述第二音频数据在各个子频带的比值的平均值；根据所述第一状态数据和所述第二状态数据，确定与所述通话状态相关的权重因子，以对所述线性输出数据进行加权滤波处理，得到发送给所述第一通话方的第三音频数据。2.根据权利要求1所述的音频数据处理方法，其中，所述第一音频数据是所述第一通话方在所述通话活动中发送给所述第二通话方的语音数据，并且所述第二音频数据是所述第二通话方在播放所述第一音频数据时采集到的音频数据。3.根据权利要求1或2所述的音频数据处理方法，其中，所述根据所述第一状态数据和所述第二状态数据，确定与所述通话状态相关的权重因子，以对所述线性输出数据进行加权滤波处理，得到发送给所述第一通话方的第三音频数据，包括：根据所述第一状态数据和所述第二状态数据确定用于控制语音失真的权衡因子；根据所述权衡因子、所述线性回声数据和所述线性输出数据，确定帧间维纳滤波器系数；根据所述维纳滤波器系数对所述线性输出数据进行滤波处理，得到第一输出音频数据作为所述第三音频数据。4.根据权利要求3所述的音频数据处理方法，其中，所述方法还包括：确定所述第一输出音频数据的频带平均增益；选择与所述频带平均增益对应的信号降低幅度值；根据所述信号降低幅度值对所述第一输出音频数据进行降低信号幅度的操作。5.根据权利要求1所述的音频数据处理方法，其中，在所述根据所述第一状态数据和所述第二状态数据，确定与所述通话状态相关的权重因子，以对所述线性输出数据进行加权滤波处理，得到发送给所述第一通话方的第三音频数据之前，所述方法还包括：对所述第一音频数据进行音频活动检测，以确定所述第一音频数据中是否包含有语音音频。6.根据权利要求1所述的音频数据处理方法，其中，在所述根据所述第一音频数据和所述第二音频数据，确定用于标识在所述第一通话方与所述第二通话方之间进行的音频通话状态的第一状态数据和第二状态数据之前，所述方法还包括：根据所述第二音频数据对所述第一音频数据进行延迟对齐处理。7.一种音频数据处理方法，包括：对第一通话方发送的第一音频数据和第二通话方采集到的第二音频数据进行线性滤波处理，得到线性回声数据，其中，所述第一通话方与所述第二通话方处于同一通话活动
中；根据第二通话方采集到的第二音频数据与所述线性回声数据确定线性输出数据；根据所述第一音频数据和所述第二音频数据，确定用于标识在所述第一通话方与所述第二通话方之间进行的音频通话状态的第一状态数据和第二状态数据，其中，所述第一状态数据是所述第一音频数据与所述第二音频数据在各个子频带的相关系数的平均值，并且所述第一状态数据是所述线性回声数据与所述第二音频数据在各个子频带的比值的平均值；根据所述第一状态数据和所述第二状态数据，选择与所述第一状态数据和所...

【专利技术属性】
技术研发人员：王子腾，纳跃跃，马骁，田彪，付强，李韵，刘章，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人