音频数据的处理方法、装置、介质和设备制造方法及图纸

技术编号：39325611 阅读：9 留言：0更新日期：2023-11-12 16:04

公开了一种音频数据的处理方法、装置、存储介质和电子设备，其中，方法包括：获取在目标场景中的多个音频采集设备采集的音频数据；基于第一预设算法，对音频数据进行声源分离，得到至少一路第一音频信号，并确定各第一音频信号与多个音区之间的信号音区对应关系；基于第二预设算法，对音频数据进行声源分离，得到至少一路第二音频信号；确定各第一音频信号与各第二音频信号之间的信号对应关系；基于信号对应关系，分别对存在对应关系的第一音频信号与第二音频信号进行混合处理，得到各第一音频信号分别对应的目标音频信号；基于信号音区对应关系，分别确定各目标音频信号对应的目标音区。本公开实现了场景中分布式音频采集设备的精准拾音。精准拾音。精准拾音。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据的处理方法、装置、介质和设备

[0001]本公开涉及信号处理
，尤其涉及一种音频数据的处理方法、装置、存储介质和电子设备。

技术介绍

[0002]随着语音技术的发展，语音交互技术也被广泛应用至各种场景，例如家居中的智能设备、汽车上的交互应用等，为人们的日常生活和出行带来了极大的便利。语音交互的准确率和可靠性受到环境的影响较大，例如，开放式环境具有噪声分布范围大、混响高、距离远等特点，导致语音交互设备获取语音指令的难度较大，造成语音交互的准确率和可靠性下降。
[0003]对于车辆内部等封闭式环境，虽然具有低混响、噪声分布范围较小、距离近等优势，但同时也提出了新的挑战：如何针对特定位置(座位)进行语音增强，以便从多个音频信号中准确地分离出语音指令。
[0004]相关技术中，通常采用分布式的音频采集设备实现封闭场景中多音区的拾音需求，然而，这种方式中的每个音频采集设备采集的音频数据包括整个场景中的各个位置声源发出的音频信号，如何准确地从音频数据中分离出各个位置声源发出的音频信号，以针对特定位置声源发出的音频信号进行语音增强，是一个急需解决的问题。

技术实现思路

[0005]为了解决上述技术问题，提出了本公开。本公开的实施例提供了一种音频数据的处理方法、装置、存储介质和电子设备，以准确地从音频数据中分离出各个位置声源发出的音频信号。
[0006]根据本公开实施例的第一个方面，提供了一种音频数据的处理方法，包括：
[0007]获取在目标场景中的多个音频采集设备采集的...

【技术保护点】

【技术特征摘要】
1.一种音频数据的处理方法，包括：获取在目标场景中的多个音频采集设备采集的音频数据，其中，所述多个音频采集设备与所述目标场景中的多个音区之间一一对应；基于第一预设算法，对所述音频数据进行声源分离，得到至少一路第一音频信号，并确定各所述第一音频信号与所述多个音区之间的信号音区对应关系；基于第二预设算法，对所述音频数据进行声源分离，得到至少一路第二音频信号；确定各所述第一音频信号与各所述第二音频信号之间的信号对应关系；基于所述信号对应关系，分别对存在对应关系的第一音频信号与第二音频信号进行混合处理，得到各所述第一音频信号分别对应的目标音频信号；基于所述信号音区对应关系，分别确定各所述目标音频信号对应的目标音区。2.根据权利要求1所述的方法，其中，基于所述信号对应关系，分别对存在对应的第一音频信号与第二音频信号进行混合处理，得到各所述第一音频信号分别对应的目标音频信号，包括：确定各所述第一音频信号分别对应的信噪比；基于所述信噪比，确定各所述第一音频信号分别对应的第一权重以及各所述第二音频信号分别对应的第二权重，其中，所述第一权重与所述信噪比正相关，所述第二权重与所述信噪比负相关；基于所述第一权重和所述第二权重，确定具有对应关系的第一音频信号与第二音频信号的加权和，得到各所述第一音频信号分别对应的加权和；将各所述第一音频信号分别对应的加权和确定为各所述第一音频信号分别对应的目标音频信号。3.根据权利要求2所述的方法，其中，确定各所述第一音频信号与各所述第二音频信号之间的信号对应关系，包括：确定各所述第一音频信号的第一编号；确定各所述第二音频信号的第二编号；确定各所述第一音频信号分别与各所述第二音频信号之间的相似度，得到各第一相似度，并确定所述各第一相似度对应的第一编号和第二编号；将所述各第一相似度作为矩阵元素，构建相似度矩阵，所述矩阵元素的下标表征所述各第一相似度对应的第一编号和所述第二编号；从所述相似度矩阵中确定出符合预设条件的目标矩阵元素；基于所述目标矩阵元素的下标，确定各所述第一音频信号与各所述第二音频信号的信号对应关系。4.根据权利要求1至3所述的方法，其中，所述第一预设算法为多通道自适应滤波算法；所述基于第一预设算法，对所述音频数据进行声源分离，得到至少一路第一音频信号，并确定各所述第一音频信号与所述多个音区之间的信号音区对应关系，包括：确定所述多个音频采集设备分别对应的第一音频信号在多通道自适应滤波算法输出的信号序列中的排列顺序；利用多通道自适应滤波算法对所述音频数据进行声源分离，得到所述信号序列，所述信号序列由各所述第一音频信号按照所述排列顺序排列而成；
基于所述排列顺序，确定各所述第一音频信号与所述多个音频采集设备的信号设备...

【专利技术属性】
技术研发人员：程光伟，
申请(专利权)人：南京地平线机器人技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人