一种声源分析方法及系统技术方案

技术编号:27829921 阅读:29 留言:0更新日期:2021-03-30 11:29
本发明专利技术公开了一种声源分析方法及系统,方法包括:获取高信噪比音频角度,获取低信噪比音频角度;基于高信噪比音频角度进行投票统计,得到第一说话人位置;基于低信噪比音频角度和第一说话人位置进行投票统计,得到噪声位置。本发明专利技术能够有效的分析出声源中的说话人位置和噪声位置。置和噪声位置。置和噪声位置。

【技术实现步骤摘要】
一种声源分析方法及系统


[0001]本专利技术涉及数据分析
,尤其涉及一种声源分析方法及系统。

技术介绍

[0002]传统的SRP(Steered Responser Power,可控响应功率)算法声源定位技术,对回声消除后的信号在空间各个方向做固定波束形成,波束输出功率最大的方向即为当前帧的声源方向,但是无法对声源类型做出判别。
[0003]因此,如何有效的对声源进行分析,以判别出声源的不同类型,是一项亟待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种声源分析方法,能够有效的判别出声源的不同类型。
[0005]本专利技术提供了一种声源分析方法,包括:
[0006]获取高信噪比音频角度;
[0007]获取低信噪比音频角度;
[0008]基于所述高信噪比音频角度进行投票统计,得到第一说话人位置;
[0009]基于所述低信噪比音频角度和所述第一说话人位置进行投票统计,得到噪声位置。
[0010]优选地,所述方法还包括:
[0011]获取视频角度;
[0012]基于所述高信噪比音频角度和所述视频角度进行投票统计,得到第二说话人位置;
[0013]基于所述低信噪比音频角度和所述第二说话人位置进行投票统计,得到噪声位置。
[0014]优选地,所述获取高信噪比音频角度,包括:
[0015]获取原始角度;
[0016]当信噪比大于预设值时,基于信噪比高低对所述原始角度进行筛选,得到高信噪比音频角度。
[0017]优选地,所述获取低信噪比音频角度,包括:
[0018]获取原始角度;
[0019]基于信噪比高低对所述原始角度进行筛选,得到高信噪比音频角度。
[0020]优选地,所述获取视频角度包括:
[0021]基于人脸识别得到人脸坐标或基于骨架识别得到头部坐标;
[0022]将所述人脸坐标或头部坐标转化到与麦克风阵列统一的坐标系中,得到视频角度。
[0023]一种声源分析系统,包括:
[0024]第一获取模块,用于获取高信噪比音频角度;
[0025]第二获取模块,用于获取低信噪比音频角度;
[0026]第一分析模块,用于基于所述高信噪比音频角度进行投票统计,得到第一说话人位置;
[0027]第二分析模块,用于基于所述低信噪比音频角度和所述第一说话人位置进行投票统计,得到噪声位置。
[0028]优选地,所述系统还包括:
[0029]第三获取模块,用于获取视频角度;
[0030]第三分析模块,用于基于所述高信噪比音频角度和所述视频角度进行投票统计,得到第二说话人位置;
[0031]第四分析模块,用于基于所述低信噪比音频角度和所述第二说话人位置进行投票统计,得到噪声位置。
[0032]优选地,所述第一获取模块具体用于:
[0033]获取原始角度;
[0034]当信噪比大于预设值时,基于信噪比高低对所述原始角度进行筛选,得到高信噪比音频角度。
[0035]优选地,所述第二获取模块具体用于:
[0036]获取原始角度;
[0037]基于信噪比高低对所述原始角度进行筛选,得到高信噪比音频角度。
[0038]优选地,所述第三获取模块具体用于:
[0039]基于人脸识别得到人脸坐标或基于骨架识别得到头部坐标;
[0040]将所述人脸坐标或头部坐标转化到与麦克风阵列统一的坐标系中,得到视频角度。
[0041]综上所述,本专利技术公开了一种声源分析方法,当需要对声源进行分析时,首先获取高信噪比音频角度,获取低信噪比音频角度;然后基于高信噪比音频角度进行投票统计,得到第一说话人位置;基于低信噪比音频角度和第一说话人位置进行投票统计,得到噪声位置。本专利技术能够有效的分析出声源中的说话人位置和噪声位置。
附图说明
[0042]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0043]图1为本专利技术公开的一种声源分析方法实施例1的方法流程图;
[0044]图2为本专利技术公开的一种投票区间的划分示意图;
[0045]图3为本专利技术公开的一种投票统计示意示意图;
[0046]图4为本专利技术公开的仅使用高信噪比音频角度筛选出说话人角度的流程示意图;
[0047]图5为本专利技术公开的噪声角度统计的流程示意图;
[0048]图6为本专利技术公开的一种声源分析方法实施例2的方法流程图;
[0049]图7为本专利技术公开的结合视频角度判决说话人角度的流程示意图。
具体实施方式
[0050]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0051]如图1所示,为本专利技术公开的一种声源分析方法实施例1的方法流程图,所述方法可以包括以下步骤:
[0052]S101、获取高信噪比音频角度;
[0053]当需要对声源进行分析,确定出说话人位置和噪声位置时,首先获取高高信噪比音频角度;其中,高信噪比音频角度由原始声源定位结果处理得到。
[0054]具体的,在获取高信噪比音频角度时,原始角度由波束形成方位估计得到,在求得波束输出的功率后,在所有可能的(0

360
°
)声源位置范围搜索波束输出功率最大值,从而求得声源定位的原始角度。本专利技术可以基于联合可控响应功率和相位变换(SRP

PHAT)进行声源定位,具有较好的抗噪性、抗混响性及较强的鲁棒性,在弱噪声和适度混响的环境下仍然有较好的表现。
[0055]高信噪比音频角度是在获得原始角度后,根据SNR(SIGNAL NOISE RATIO,信噪比)高低对角度进行筛选得到的。本专利技术的信噪比是根据预估信噪比和计算信号的倒谱距离得到的。当SNR大于n dB时,则认为存在有效语音信号输出,并输出当前帧的定位角度,若SNR小于n dB,则认为当前帧的信号是噪声,无有效语音信号,此时该角度不进行更新。
[0056]为了剔除输出角度中的噪声,可以将经过上述处理的角度缓存7帧,并进行中值滤波,输出得到场景分析需要的高信噪比音频角度,该高信噪比音频角度用于说话人方位统计。
[0057]S102、获取低信噪比音频角度;
[0058]同时,获取低信噪比音频角度;其中,低信噪比音频角度由原始声源定位结果处理得到。
[0059]具体的,在获取低信噪比音频角度时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声源分析方法,其特征在于,包括:获取高信噪比音频角度;获取低信噪比音频角度;基于所述高信噪比音频角度进行投票统计,得到第一说话人位置;基于所述低信噪比音频角度和所述第一说话人位置进行投票统计,得到噪声位置。2.根据权利要求1所述的方法,其特征在于,还包括:获取视频角度;基于所述高信噪比音频角度和所述视频角度进行投票统计,得到第二说话人位置;基于所述低信噪比音频角度和所述第二说话人位置进行投票统计,得到噪声位置。3.根据权利要求1或2所述的方法,其特征在于,所述获取高信噪比音频角度,包括:获取原始角度;当信噪比大于预设值时,基于信噪比高低对所述原始角度进行筛选,得到高信噪比音频角度。4.根据权利要求1或2所述的方法,其特征在于,所述获取低信噪比音频角度,包括:获取原始角度;基于信噪比高低对所述原始角度进行筛选,得到高信噪比音频角度。5.根据权利要求2所述的方法,其特征在于,所述获取视频角度包括:基于人脸识别得到人脸坐标或基于骨架识别得到头部坐标;将所述人脸坐标或头部坐标转化到与麦克风阵列统一的坐标系中,得到视频角度。6.一种声源分析系统,其特征在于,包括:第一获取模块,用于获取高信噪比音频...

【专利技术属性】
技术研发人员:程佳李骊
申请(专利权)人:北京华捷艾米科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1