本发明专利技术适用于声音处理技术领域,提供一种声源定位方法及装置,所述方法包括:麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;确定经过所述两路声源信号的互功率谱密度函数;确定随当前信噪比变化而调整的加权函数;根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;根据麦克风阵列的排列分布和所述声源信号到达其中任意两个麦克风的时延,定位声源位置。本发明专利技术采用的加权函数能够随当前信噪比的变化做出相应调整,使得在声源信噪比改变的环境下,通过相应调整加权函数,亦可准确获取声源信号的时延,提高了声源定位精度。
【技术实现步骤摘要】
本专利技术属于声音处理
,尤其涉及一种声源定位方法及装置。
技术介绍
在视频会议、安防或是在ー些エ业应用领域中常常需要对声源进行定位,但是在一些场合中,由于外部声源环境的不确定性,语音信号受到外界噪声干扰,使得信噪比发生变化,现有声源定位技术中,通过麦克风阵列得到ー组声音数据,再经过预处理后用相位变换广义交互相关方法(PHAT-GCC)进行时延估计,根据时延结果和麦克风阵列中麦克风的排列分布,通过几何模型即可确定声源的位置。由于现有的PHAT-GCC方法中,由于声源信号的信噪比可能会随环境发生变化,在信号能量较小的吋,进行频域加权的加权函数的分母会趋于零,使得加权函数的取值变得非常大,这样获取的时延结果误差也较大,最后定位出的声源位置也会存在很大误差。
技术实现思路
鉴于上述问题,本专利技术的目的在于提供一种声源定位方法,g在解决现有声源定位技术中由于声源信号的信噪比发生变化时,加权函数的值可能变得非常大,使得声源定位结果误差很大的技术问题。本专利技术是这样实现的,一种声源定位方法,包括下述步骤麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;确定经过所述预处理后的两路声源信号的互功率谱密度函数;确定随当前信噪比变化而调整的加权函数;根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。本专利技术的再一目的在于提供一种声源定位装置,包括麦克风阵列采集预处理单元,用于麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;互功率谱密度确定单元,用于确定经过所述预处理后的两路声源信号的互功率谱密度函数;加权函数确定单元,用于确定随当前信噪比变化而调整的加权函数;时延确定单元,用于根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;声源定位単元,用于根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。本专利技术的有益效果是由于本专利技术提供的声源定位方法和装置所采用加权函数能够随当前信噪比的变化做出相应调整,使得由于背景噪声、混响等因素的影响,在声源信噪比改变的环境下,通过相应调整加权函数,亦可准确获取声音信号的时延,提高了声源定位精度。附图说明图I是本专利技术第一实施例提供的 声源定位方法的流程图;图2是本专利技术第二实施例提供的声源定位方法的流程图;图3是本专利技术第三实施例提供的声源定位装置的结构方框图;图4是本专利技术第四实施例提供的声源定位装置的结构方框图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进ー步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。实施例一:图I示出了本专利技术第一实施例提供的声源定位方法的流程,为了便于说明仅示出了与本专利技术实施例相关的部分。本专利技术实施例提供的声源定位方法包括步骤S101、麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理。麦克风阵列是多个麦克风按照一定方式排列的麦克风集合,在声源定位技术中常用于声源信号采集,可以得到一组声源信号,在本步骤中,任取其中的两个麦克风采集到的声源信号进行预处理,包括滤波和分帧等。步骤S102、确定经过所述预处理后的两路声源信号的互功率谱密度函数;步骤S103、确定随当前信噪比变化而调整的加权函数;步骤S104、根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延(时间差)。 步骤S102-S104提供了确定声源信号到达两个麦克风的时延的过程,确定时延的精确度决定了声源定位的精确度,一般的时延确定方法是首先确定两路声源信号的互功率谱密度函数、以及加权函数,再根据所述互功率谱密度函数和加权函数的乘积进行傅立叶逆变换得到两路信号的互相关函数的值序列,根据所述互相关函数的最大值确定所述时延。但是现有的加权函数无法跟随当前信噪比的变化而变化,这种加权函数无法抵御较大的背景噪声和混响,并且当语音信号能力较小时,所述加权函数的取值非常大,后续确定时延会产生很大误差。而在本专利技术实施例中,步骤S103所确定的加权函数随当前信噪比变化而做出相应调整,使得加权函数的函数值不会因为语言信号能量较小时而变得非常大,迸而保证的确定时延的精确度。步骤S105、根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。声源定位技术的原理是通过确定声源信号到达两个麦克风的时延,井根据所述麦克风的具体位置,通过几何模型确定声源具体位置,本实施例在确定了较高精确度的时延后,可以通过几何分析方法精确定位声源位置,具体的定位方法与现有声源定位技术相同,此处不再赘述。本专利技术实施例与现有声源定位技术的主要区别在于,本实施例提供的加权函数随当前信噪比变化而相应调整,使得加权函数的函数值不会因为当前信噪比改变而发生剧烈改变,这样最后确定的时延值的精确度得到了保证,进而提高了声源定位精确度。实施例ニ :图2示出了本专利技术第二实施例提供的声源定位方法的流程,为了便于说明仅示出了与本专利技术实施例相关的部分。本专利技术实施例提供的声源定位方法包括步骤S201、麦克风阵列采集声源信号;步骤S202、对所述麦克风阵列中任意两个麦克风采集的声源信号进行带通滤波,得到两路带通滤波后的声源信号;步骤S203、对所述两路带通滤波后的声源信号进行加窗分帧处理,得到两路短时平稳信号。上述步骤S201-S03作为实施例一中步骤SlOl的ー种具体优选的实施方式。在步骤S201中,假设所述两个麦克风采集到的声源信号分别为X1 (t) = B1S1 (t) +Ii1 (t) (I)x2 (t) = B2S1 (t+D) +n2 (t) (2)其中,ai、a2为声音衰减因子,由于是声源为近场信号,可以认为ai、a2为1,D为声源信号到达所述两个麦克风的时延,ηια)、η2α)为所述两个麦克风接收到的噪声信号。在步骤S202中,对麦克风采集到的声源信号进行带通滤波,将低频段和高频段的噪声滤除,为后续处理提供两路带通滤波后的声源信号。在步骤S203中,作为ー种实现方式,使用汉明窗函数对所述两路带通滤波后的声源信号进行分帧,得到两路短时平稳信号,加窗分帧一般采用帧与帧重叠的方法。两路短时平稳信号为S1 ( λ , n) = X1 (n+d( λ -I)N) w(η) (3)s2 ( λ , η) = X2 (n+d( λ-I)N) w(η) (4)其中w(n)为汉明窗函数,N为窗函数w(n)的长度,d为相邻帧之间的移位參数,λ为帧数。步骤S204、通过端点检测判断所述的两路短时平稳信号是否为语音信号;是执行步骤205 ;否执行步骤207。步骤S205、确定当前信噪比,当前信噪比为SNR(A) = aSNR( λ-l) + (l-a) SNR_0,其中SNR(本文档来自技高网...
【技术保护点】
一种声源定位方法,其特征在于,所述方法包括:麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;确定经过所述预处理后的两路声源信号的互功率谱密度函数;确定随当前信噪比变化而调整的加权函数;根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。
【技术特征摘要】
【专利技术属性】
技术研发人员:彭迎标,邵诗强,
申请(专利权)人:TCL集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。