音频信号的处理方法及相关设备技术

技术编号：37104809 阅读：31 留言：0更新日期：2023-04-01 05:04

本申请实施例提供了一种音频信号的处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，涉及人工智能技术领域。其中，音频信号的处理方法包括：提取输入音频信号中的第一频域特征向量；基于第一频域特征向量确定输入音频信号的编码向量；基于编码向量确定输入音频信号中的设定声源的声源信号；该方法的实施有利于提升在输入音频信号中确定设定声源的声源信号的准确性。同时，由电子设备执行的上述音频信号的处理方法可以使用人工智能模型来执行。模型来执行。模型来执行。

全部详细技术资料下载

【技术实现步骤摘要】
音频信号的处理方法及相关设备

[0001]本申请涉及人工智能
，具体而言，本申请涉及一种音频信号的处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]在进行音频采集的过程中，由于环境条件的限制，一般采集到的音频信号除了声源对象的音频信号以外，还包括一些环境音的音频信号。为此，需要对所采集的音频信号中各个声源的音频信号进行处理，才可以获取得到仅包括所需声源对象的音频信号，以提高所采集音频信号的质量。

技术实现思路

[0003]本申请实施例提供了一种音频信号的处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，可以解决相关技术中所采集音频信号包括环境音的技术问题。所述技术方案如下：
[0004]根据本申请实施例的一个方面，提供了一种音频信号的处理方法，该方法包括：
[0005]提取输入音频信号中的第一频域特征向量；
[0006]基于所述第一频域特征向量确定所述输入音频信号的编码向量；
[0007]基于所述编码向量确定所述输入音频信号...

【技术保护点】

【技术特征摘要】
1.一种音频信号的处理方法，其特征在于，包括：提取输入音频信号中的第一频域特征向量；基于所述第一频域特征向量确定所述输入音频信号的编码向量；基于所述编码向量确定所述输入音频信号中的设定声源的声源信号。2.根据权利要求1所述的方法，其特征在于，提取输入音频信号中的第一频域特征向量，包括：提取输入音频信号中的至少两种尺度的第一频域特征向量。3.根据权利要求2所述的方法，其特征在于，还包括：提取输入音频信号中的第一时域特征向量；基于所述第一频域特征向量确定所述输入音频信号的编码向量，包括：融合所述第一频域特征向量和所述第一时域特征向量得到所述输入音频信号的编码向量。4.根据权利要求3所述的方法，其特征在于，所述融合所述第一频域特征向量与第一时域特征向量得到所述输入音频信号的编码向量，包括：在所述第一频域特征向量和所述第一时域特征向量中，获取预定基准特征向量；对于除预定基准特征向量之外的其他至少一个特征向量，将所述至少一个特征向量和所述预定基准特征向量在帧级别进行对齐，得到对齐后的第二频域特征向量和第二时域特征向量；融合所述第二频域特征向量与第二时域特征向量，得到所述输入音频信号的编码向量。5.根据权利要求1
‑
4中任一项所述的方法，其特征在于，所述基于所述编码向量确定所述输入音频信号中的设定声源的声源信号，包括以下至少一项：基于所述编码向量分离所述输入音频信号中各声源分别对应的声源信号；基于所述编码向量分离所述输入音频信号，得到目标声源对应的目标声源信号与其他声源对应的其他声源信号。6.根据权利要求1
‑
4中任一项所述的方法，其特征在于，所述基于所述编码向量确定所述输入音频信号中的设定声源的声源信号，包括：对所述编码向量进行特征分析，确定所述输入音频信号中的设定声源的掩码向量；基于所述掩码向量与所述第一频域特征向量，确定所述输入音频信号中的设定声源的声源信号。7.根...

【专利技术属性】
技术研发人员：杨磊，王维钦，刘炜，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人