【技术实现步骤摘要】
一种基于声传递函数学习的非监督声源定向方法
本专利技术属于基于麦克风阵列的声源定向领域,具体涉及一种基于声传递函数学习的非监督声源定向方法。
技术介绍
基于麦克风阵列的声源定向技术是一种被动定向技术。根据麦克风阵列的原理,基于麦克风阵列的声源定向的线索包括多通道信号的到达时间差和强度差信息。目前,基于麦克风阵列的声源定向任务可以分成如下五类:基于到达时间差的声源定向估计,基于高分辨率谱估计的声源定向估计,基于波束形成的方法,基于声场分析的方法,基于神经网络的方法。基于到达时间差的声源定向方法,是利用麦克风阵列的分布信息和到达时间差进行估计,典型的方法如广义互相关计算的方法,这一类方法的缺点是存在传递误差的问题,即时间差估计不准确的前提下,会影响后续利用几何关系求解方向的计算,此外,在多声源情况下,到达时间差的估计会出现较大误差。基于高分辨率谱估计的方法,是利用多通道麦克风信号求得协方差矩阵,并通过特征值分解求得信号子空间和噪声子空间,通过两个子空间估计声源的方向,代表的方法有多重信号分类法,这一类方法的缺点是受混响干扰较大。 ...
【技术保护点】
1.一种基于声传递函数学习的非监督声源定向方法,其步骤包括:/n1)建立一网络模型,该网络模型包括一共享卷积层和多个自编码网络框架,每一自编码网络框架对应一设定的声源方向,用于实现对该声源方向的传递函数滤波和逆滤波过程的模拟;所述共享卷积层用于对输入的多通道时域信号进行处理,获取不同声源方向共同的传播特性,并输出多通道等长时域信号到各个自编码网络框架;每一自编码网络框架包括一编码层和一解码层,编码层用于对输入的多通道等长时域信号中每一个通道的时域信号,构建一个全连接层模拟传递函数逆过程,得到各通道恢复信号并对其进行叠加,然后利用一维卷积层对全连接输出的多通道叠加信号进行处理 ...
【技术特征摘要】
1.一种基于声传递函数学习的非监督声源定向方法,其步骤包括:
1)建立一网络模型,该网络模型包括一共享卷积层和多个自编码网络框架,每一自编码网络框架对应一设定的声源方向,用于实现对该声源方向的传递函数滤波和逆滤波过程的模拟;所述共享卷积层用于对输入的多通道时域信号进行处理,获取不同声源方向共同的传播特性,并输出多通道等长时域信号到各个自编码网络框架;每一自编码网络框架包括一编码层和一解码层,编码层用于对输入的多通道等长时域信号中每一个通道的时域信号,构建一个全连接层模拟传递函数逆过程,得到各通道恢复信号并对其进行叠加,然后利用一维卷积层对全连接输出的多通道叠加信号进行处理得到一维时域信号;解码层,用于对输入的一维时域信号经多通道的全连接网络后,恢复出各通道的声源信号;
2)分两阶段对该网络模型进行训练:在第一阶段,分批使用各设定声源方向的采集信号,对该网络模型的全部参数进行更新训练;其中每一批数据为同一设定声源方向的采集...
【专利技术属性】
技术研发人员:曲天书,吴玺宏,王奕文,
申请(专利权)人:北京大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。