音频采集方法技术

技术编号:39568244 阅读:8 留言:0更新日期:2023-12-03 19:19
本申请公开了一种音频采集方法

【技术实现步骤摘要】
音频采集方法、装置、电子设备以及存储介质


[0001]本申请涉及语音处理
,更具体地,涉及一种音频采集方法

装置

电子设备以及存储介质


技术介绍

[0002]随着科学技术的发展,语音处理技术的应用越来越多样化,如,会议语音自动采集的应用

相关技术中,由于在会议语音采集的场景下,存在用户走动使得麦克风采集的音频质量低下的问题

因此,相关技术中存在音频采集的声源定位速率慢,采集的音频的音质低下的问题


技术实现思路

[0003]鉴于上述问题,本申请提出了一种音频采集方法

装置

电子设备以及存储介质,可以通过结合声纹的方式进行声源定位,提高声源定位的速率,也提高了音频采集的质量

[0004]第一方面,本申请实施例提供了一种音频采集方法,所述方法包括:在至少一个对象各自对应的预设声源角度范围内,基于预设麦克风
MIC
阵列获取至少一个波束数据;从所述至少一个波束数据中确定目标波束数据,其中,所述目标波束数据对应的声纹特征与目标对象对应的声纹特征匹配,所述目标对象为所述至少一个对象中的一个或多个对象;根据所述目标波束数据更新所述目标对象对应的预设声源角度范围,获得目标声源角度范围;在所述目标声源角度范围内对所述目标对象进行音频数据采集,获得目标音频数据

[0005]第二方面,本申请实施例提供了一种音频采集方装置,所述装置包括:波束数据获取模块

目标波束数据确定模块

目标声源角度范围获得模块以及目标音频数据采集模块

其中,波束数据获取模块用于在至少一个对象各自对应的预设声源角度范围内,基于预设麦克风
MIC
阵列获取至少一个波束数据;目标波束数据确定模块,用于从所述至少一个波束数据中确定目标波束数据,其中,所述目标波束数据对应的声纹特征与目标对象对应的声纹特征匹配,所述目标对象为所述至少一个对象中的一个或多个对象;目标声源角度范围获得模块用于根据所述目标波束数据更新所述目标对象对应的预设声源角度范围,获得目标声源角度范围;目标音频数据采集模块用于在所述目标声源角度范围内对所述目标对象进行音频数据采集,获得目标音频数据

[0006]第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行上述方法

[0007]第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法

[0008]本申请实施例提供的音频采集方法

装置

电子设备以及存储介质,通过在至少一个对象各自对应的预设声源角度范围内,基于预设麦克风
MIC
阵列获取至少一个波束数据;从至少一个波束数据中确定目标波束数据,其中,目标波束数据对应的声纹特征与目标对
象对应的声纹特征匹配,目标对象为至少一个对象中的一个或多个对象;根据目标波束数据更新目标对象对应的预设声源角度范围,获得目标声源角度范围;在目标声源角度范围内对目标对象进行音频数据采集,获得目标音频数据,进而通过结合声纹的方式进行声源定位,提高了声源定位的速率,也提高了音频采集的质量

附图说明
[0009]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图

[0010]图1示出了本申请一实施例提供的音频采集方法的流程示意图;
[0011]图2示出了本申请一实施例提供的音频采集方法的流程示意图;
[0012]图3示出了本申请一实施例提供的音频采集方法的流程示意图;
[0013]图4示出了本申请一实施例提供的音频采集方装置的模块框图;
[0014]图5示出了本申请实施例用于执行根据本申请实施例的音频采集方法的电子设备的框图;
[0015]图6示出了本申请实施例的用于保存或者携带实现根据本申请实施例的音频采集方法的程序代码的存储单元

具体实施方式
[0016]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚

完整地描述

[0017]随着科学技术的发展,会议语音采集系统的应用越来越广泛,如,会议语音系统可以应用于远程多方会议

会议记录自动整理等场景

相关技术中,会议语音采集大多通过声源定位的方式进行音频采集

其中,声源定位的方式依赖于声音的强度,而声音信号的强度符合统计的规律,也即需要一段时间的累积,因此,相关技术中,声源定位的速度大多为百毫秒量级的

另外,声源定位受噪声影响较大,在噪声场景下,声源定位算法容易出错,得到准确结果的时间可能要秒级

因此,相关技术中,存在声源定位速率慢的问题

[0018]相应的,在会议语音采集场景下,若讲话人移动由于声源定位的速度不够快,导致
MIC
阵列波束形成的改变速度跟不上讲话人的移动,使得采集的语音信号质量急剧下降

因此,相关技术中存在音频采集的声源定位速率慢,采集的音频的音质低下的问题

[0019]针对上述问题,专利技术人经过长期的研究发现,并提出了本申请实施例提供的音频采集方法

装置

电子设备以及存储介质,通过结合声纹的方式进行声源定位,提高声源定位的速率,也提高了音频采集的质量

其中,具体的音频采集方法在后续的实施例中进行详细的说明

[0020]请参阅图1,图1示出了本申请一实施例提供的音频采集方法的流程示意图

该音频采集方法通过结合声纹的方式进行声源定位,提高声源定位的速率,也提高了音频采集的质量

在具体的实施例中,该音频采集方法可以应用于如图4所示的音频采集方装置
200
以及配置有音频采集方装置
200
的电子设备
100(

5)。
下面将以电子设备为例,说明本实施
例的具体流程,当然,可以理解的,本实施例所应用的电子设备可以包括智能手机

平板电脑

穿戴式电子设备等,在此不做限定

下面将针对图1所示的流程进行详细的阐述,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种音频采集方法,其特征在于,所述方法包括:在至少一个对象各自对应的预设声源角度范围内,基于预设麦克风
MIC
阵列获取至少一个波束数据;从所述至少一个波束数据中确定目标波束数据,其中,所述目标波束数据对应的声纹特征与目标对象对应的声纹特征匹配,所述目标对象为所述至少一个对象中的一个或多个对象;根据所述目标波束数据更新所述目标对象对应的预设声源角度范围,获得目标声源角度范围;在所述目标声源角度范围内对所述目标对象进行音频数据采集,获得目标音频数据
。2.
根据权利要求1所述的方法,其特征在于,所述在所述目标声源角度范围内对所述目标对象进行音频数据采集,获得目标音频数据,包括:若所述目标声源角度范围与所述至少一个对象中除所述目标对象的其他对象对应的预设声源角度范围在所述预设
MIC
阵列中存在重叠范围,则获取所述重叠范围内的待判定音频;若所述待判定音频对应的声纹特征与所述目标对象对应的声纹特征匹配,则将所述待判定音频确定为所述目标音频数据
。3.
根据权利要求1所述的方法,其特征在于,在所述在至少一个对象各自对应的预设声源角度范围内,基于预设麦克风
MIC
阵列获取至少一个波束数据之前,还包括:基于声源定位算法获得所述至少一个对象各自对应的声源角度;基于所述至少一个对象各自对应的声源角度进行所述预设
MIC
阵列的波束成形运算,获得所述至少一个对象各自对应的音频数据;对所述至少一个对象各自对应的音频数据进行声纹特征提取,获得所述至少一个对象各自对应的声纹特征,并将所述至少一个对象各自对应的声源角度与所述至少一个对象各自对应的声纹特征进行关联存储
。4.
根据权利要求3所述的方法,其特征在于,在所述对所述至少一个对象各自对应的音频数据进行声纹特征提取,获得所述至少一个对象各自对应的声纹特征,并将所述至少一个对象各自对应的声源角度与所述至少一个对象各自对应的声纹特征进行关联存储之后,还包括:获取所述至少一个对象各自对应的声源角度,并根据所述关联存储获取所述至少一个对象各自对应的声纹特征;根据所述至少一个对象各自对应的声源角度,确定所述至少一个对象各自对应的预设声源角度范围
。5.
根据权利要求4所述的方法,其特征在于,所述根据所述至少一个对象各自对应的声源角度,确定所述至少一个对象各自对应的预设声源角度范围,包括:根据所述至少一个对象各自对应的声源角...

【专利技术属性】
技术研发人员:宋政斌李亚桐张伟彬陈东鹏
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1