音频数据的处理方法、装置、介质和设备制造方法及图纸

技术编号:39325611 阅读:9 留言:0更新日期:2023-11-12 16:04
公开了一种音频数据的处理方法、装置、存储介质和电子设备,其中,方法包括:获取在目标场景中的多个音频采集设备采集的音频数据;基于第一预设算法,对音频数据进行声源分离,得到至少一路第一音频信号,并确定各第一音频信号与多个音区之间的信号音区对应关系;基于第二预设算法,对音频数据进行声源分离,得到至少一路第二音频信号;确定各第一音频信号与各第二音频信号之间的信号对应关系;基于信号对应关系,分别对存在对应关系的第一音频信号与第二音频信号进行混合处理,得到各第一音频信号分别对应的目标音频信号;基于信号音区对应关系,分别确定各目标音频信号对应的目标音区。本公开实现了场景中分布式音频采集设备的精准拾音。精准拾音。精准拾音。

【技术实现步骤摘要】
音频数据的处理方法、装置、介质和设备


[0001]本公开涉及信号处理
,尤其涉及一种音频数据的处理方法、装置、存储介质和电子设备。

技术介绍

[0002]随着语音技术的发展,语音交互技术也被广泛应用至各种场景,例如家居中的智能设备、汽车上的交互应用等,为人们的日常生活和出行带来了极大的便利。语音交互的准确率和可靠性受到环境的影响较大,例如,开放式环境具有噪声分布范围大、混响高、距离远等特点,导致语音交互设备获取语音指令的难度较大,造成语音交互的准确率和可靠性下降。
[0003]对于车辆内部等封闭式环境,虽然具有低混响、噪声分布范围较小、距离近等优势,但同时也提出了新的挑战:如何针对特定位置(座位)进行语音增强,以便从多个音频信号中准确地分离出语音指令。
[0004]相关技术中,通常采用分布式的音频采集设备实现封闭场景中多音区的拾音需求,然而,这种方式中的每个音频采集设备采集的音频数据包括整个场景中的各个位置声源发出的音频信号,如何准确地从音频数据中分离出各个位置声源发出的音频信号,以针对特定位置声源发出的音频信号进行语音增强,是一个急需解决的问题。

技术实现思路

[0005]为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种音频数据的处理方法、装置、存储介质和电子设备,以准确地从音频数据中分离出各个位置声源发出的音频信号。
[0006]根据本公开实施例的第一个方面,提供了一种音频数据的处理方法,包括:
[0007]获取在目标场景中的多个音频采集设备采集的音频数据,其中,所述多个音频采集设备与所述目标场景中的多个音区之间一一对应;
[0008]基于第一预设算法,对所述音频数据进行声源分离,得到至少一路第一音频信号,并确定各所述第一音频信号与所述多个音区之间的信号音区对应关系;
[0009]基于第二预设算法,对所述音频数据进行声源分离,得到至少一路第二音频信号;
[0010]确定各所述第一音频信号与各所述第二音频信号之间的信号对应关系;
[0011]基于所述信号对应关系,分别对存在对应关系的第一音频信号与第二音频信号进行混合处理,得到各所述第一音频信号分别对应的目标音频信号;
[0012]基于所述信号音区对应关系,分别确定各所述目标音频信号对应的目标音区。
[0013]根据本公开实施例的第二个方面,提供了一种音频数据的处理装置,包括:
[0014]数据获取单元,获取在目标场景中的多个音频采集设备采集的音频数据,其中,所述多个音频采集设备与所述目标场景中的多个音区之间一一对应;
[0015]第一分离单元,被配置成对所述音频数据进行声源分离,得到至少一路第一音频
信号,并确定各所述第一音频信号与所述多个音区之间的信号音区对应关系;
[0016]第二分离单元,被配置成基于第二预设算法,对所述音频数据进行声源分离,得到至少一路第二音频信号;
[0017]信号匹配单元,被配置成确定各所述第一音频信号与各所述第二音频信号之间的信号对应关系;
[0018]信号合成单元,被配置成基于所述信号对应关系,分别对存在对应关系的第一音频信号与第二音频信号进行混合处理,得到各所述第一音频信号分别对应的目标音频信号;
[0019]音区确定单元,被配置成基于所述信号音区对应关系,分别确定各所述目标音频信号对应的目标音区。
[0020]根据本公开实施例的第三个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于实现上述方法。
[0021]根据本公开实施例的第四个方面,提供了一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述方法。
[0022]本公开第五个方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行本公开第一方面实施例提出的音频数据的处理方法。本公开实施例提出的音频数据的处理方法,利用第一预设算法从音频数据中分离出各个声源对应的第一音频信号,并确定第一音频信号与音频采集设备的音区的信号音区对应关系;利用第二预设算法从音频数据中分离出各个声源对应的第二音频信号,然后确定第一音频信号与第二音频信号的对应关系,并对具有对应关系的第一音频信号和第二音频信号进行混合处理生成质量更高的目标音频信号;之后,根据第一音频信号与音频采集设备的对应关系,确定目标音频信号对应的音区。既确保了音频数据分离的准确度,又可以确定音频信号与音区的对应关系,实现了场景中分布式音频采集设备的精准拾音,有助于提高目标场景中语音交互的准确度和可靠性。
[0023]下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
[0024]通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0025]图1

1是本公开的音频数据的处理方法的所适用的一个场景的示意图;
[0026]图1

2是对图1

1提供的场景采集的音频数据进行处理的方法示意图;
[0027]图1

3是对图1

1提供的场景采用多通道自适应滤波分离信号的示意图;
[0028]图1

4是本公开的音频数据的处理方法的一个可选示例的处理流程示意图;
[0029]图2是本公开的音频数据的处理方法的一个实施例的流程示意图;
[0030]图3是本公开一个实施例中步骤204的流程示意图;
[0031]图4是图3所示实施例中步骤2042的一个实施例的流程示意图;
[0032]图5是本公开一个实施例中步骤206的流程示意图;
[0033]图6是本公开一个实施例中步骤208的流程示意图;
[0034]图7是本公开一个实施例中步骤210的流程示意图;
[0035]图8是本公开的音频数据的处理装置的一个实施例的结构示意图;
[0036]图9

1是本公开的音频数据的处理装置的一个实施例中第一分离单元的结构示意图;
[0037]图9

2是本公开的音频数据的处理装置的另一个实施例中第一分离单元的结构示意图;
[0038]图9

3是本公开的音频数据的处理装置的一个实施例中第二分离单元的结构示意图;
[0039]图9

4是本公开的音频数据的处理装置的一个实施例中信号匹配单元的结构示意图;
[0040]图9

5是本公开的音频数据的处理装置的一个实施例中信号合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据的处理方法,包括:获取在目标场景中的多个音频采集设备采集的音频数据,其中,所述多个音频采集设备与所述目标场景中的多个音区之间一一对应;基于第一预设算法,对所述音频数据进行声源分离,得到至少一路第一音频信号,并确定各所述第一音频信号与所述多个音区之间的信号音区对应关系;基于第二预设算法,对所述音频数据进行声源分离,得到至少一路第二音频信号;确定各所述第一音频信号与各所述第二音频信号之间的信号对应关系;基于所述信号对应关系,分别对存在对应关系的第一音频信号与第二音频信号进行混合处理,得到各所述第一音频信号分别对应的目标音频信号;基于所述信号音区对应关系,分别确定各所述目标音频信号对应的目标音区。2.根据权利要求1所述的方法,其中,基于所述信号对应关系,分别对存在对应的第一音频信号与第二音频信号进行混合处理,得到各所述第一音频信号分别对应的目标音频信号,包括:确定各所述第一音频信号分别对应的信噪比;基于所述信噪比,确定各所述第一音频信号分别对应的第一权重以及各所述第二音频信号分别对应的第二权重,其中,所述第一权重与所述信噪比正相关,所述第二权重与所述信噪比负相关;基于所述第一权重和所述第二权重,确定具有对应关系的第一音频信号与第二音频信号的加权和,得到各所述第一音频信号分别对应的加权和;将各所述第一音频信号分别对应的加权和确定为各所述第一音频信号分别对应的目标音频信号。3.根据权利要求2所述的方法,其中,确定各所述第一音频信号与各所述第二音频信号之间的信号对应关系,包括:确定各所述第一音频信号的第一编号;确定各所述第二音频信号的第二编号;确定各所述第一音频信号分别与各所述第二音频信号之间的相似度,得到各第一相似度,并确定所述各第一相似度对应的第一编号和第二编号;将所述各第一相似度作为矩阵元素,构建相似度矩阵,所述矩阵元素的下标表征所述各第一相似度对应的第一编号和所述第二编号;从所述相似度矩阵中确定出符合预设条件的目标矩阵元素;基于所述目标矩阵元素的下标,确定各所述第一音频信号与各所述第二音频信号的信号对应关系。4.根据权利要求1至3所述的方法,其中,所述第一预设算法为多通道自适应滤波算法;所述基于第一预设算法,对所述音频数据进行声源分离,得到至少一路第一音频信号,并确定各所述第一音频信号与所述多个音区之间的信号音区对应关系,包括:确定所述多个音频采集设备分别对应的第一音频信号在多通道自适应滤波算法输出的信号序列中的排列顺序;利用多通道自适应滤波算法对所述音频数据进行声源分离,得到所述信号序列,所述信号序列由各所述第一音频信号按照所述排列顺序排列而成;
基于所述排列顺序,确定各所述第一音频信号与所述多个音频采集设备的信号设备...

【专利技术属性】
技术研发人员:程光伟
申请(专利权)人:南京地平线机器人技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1