音频处理方法、可读存储介质、程序产品及电子设备技术

技术编号：41457331 阅读：26 留言：0更新日期：2024-05-28 20:43

本申请涉及终端技术领域，特别涉及一种音频处理方法、可读存储介质、程序产品及电子设备。该音频处理方法应用于电子设备中，电子设备中可以存储目标用户对应的第一声纹特征以及第一模型，在电子设备获取第一音频数据时，可以将第一声纹特征以及第一音频数据输入第一模型。第一模型基于第一声纹特征抑制第一音频数据中除第一声纹特征对应的第二音频数据外的音频数据，以去除除目标用户的语音外的其他声音。如此，电子设备可以基于只包含目标用户语音的第二音频数据进行语音交互或者通话等，从而提高电子设备语音交互的准确性以及通话质量。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及终端，特别涉及一种音频处理方法、可读存储介质、程序产品及电子设备。

技术介绍

1、目前，用户通常使用手机、平板电脑等电子设备进行语音交互。电子设备可以通过麦克风等设备采集电子设备外界的音频，并基于采集的音频执行相应的操作，例如识别所采集的音频中的语音指令并执行识别出的指令、将采集的音频发送给其他电子设备以实现通话、会议、网课、直播等。

2、在一些场景中，如果电子设备的周围有噪声干扰，电子设备所采集的音频中包括噪声，例如环境噪声、用户所处环境中其他用户的声音等。如此，会影响用户利用语音进行交互的质量。例如，在用户通过语音向电子设备传递指令的场景中，电子设备会由于噪声较大而无法准确识别用户的语音指令。又例如，用户在声音嘈杂的区域进行会议、直播等的情况下，环境噪声和其他用户的声音也会被电子设备采集并传输给其他电子设备，如此，会导致其他电子设备的用户不易听清该用户的语音或者干扰其他电子设备的用户。

技术实现思路

1、本申请实施例提供了一种音频处理方法、可读存储介质、程序产品及电子设备。

<本文档来自技高网...

【技术保护点】

1.一种音频处理方法，应用于第一电子设备，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述N个第一声纹特征是基于以下方式确定的：

3.根据权利要求2所述的方法，其特征在于，所述将所述第一音频数据和N个第一声纹特征输入到第一模型中，以使得所述第一模型基于所述N个第一声纹特征得到所述第一音频中所述N个第一声纹特征对应的第二音频数据，包括：

4.根据权利要求3所述的方法，其特征在于，所述权重信息是基于以下信息中的至少一种确定的：所述第一声纹特征对应的音频数据在所述第一音频数据中的能量、所述第一声纹特征对应的音频数据在所述第一音频数据...

【技术特征摘要】

1.一种音频处理方法，应用于第一电子设备，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述n个第一声纹特征是基于以下方式确定的：

3.根据权利要求2所述的方法，其特征在于，所述将所述第一音频数据和n个第一声纹特征输入到第一模型中，以使得所述第一模型基于所述n个第一声纹特征得到所述第一音频中所述n个第一声纹特征对应的第二音频数据，包括：

4.根据权利要求3所述的方法，其特征在于，所述权重信息是基于以下信息中的至少一种确定的：所述第一声纹特征对应的音频数据在所述第一音频数据中的能量、所述第一声纹特征对应的音频数据在所述第一音频数据中的时长。

5.根据权利要求1所述的方法，其特征在于，所述第一模型为扩散模型。

6.根据权利要求5所述的方法，其特征在于，所述扩散模型是基于以下方式训练得到的：

【专利技术属性】
技术研发人员：吴彪，夏日升，李宇，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人