一种录播主机、声源测向的方法及装置制造方法及图纸

技术编号:17784772 阅读:26 留言:0更新日期:2018-04-22 16:38
本发明专利技术公开了一种录播主机、声源测向的方法及装置,通过获取录播主机中声音传感器所采集的声音信号,音频处理模块依据声音信号确定目标声源信号,并确定目标声源信号的声源方向信息,将声源方向信息发送给自由转动式摄像头;自由转动式摄像头接收音频处理模块发送的声源方向信息,并调整摄像头角度为声源方向信息所指示的声源方向,解决了录播主机集成化程度低以及测向跟踪能力差的问题。

【技术实现步骤摘要】
一种录播主机、声源测向的方法及装置
本专利技术涉及声源定位
,尤其涉及一种录播主机、声源测向的方法及装置。
技术介绍
随着视频监控技术的不断进步,在一些视频会议、安防、直录播课堂或者庭审等场景中经常需要利用录播主机对场景进行实时采集,而在录播过程中利用摄像头对场景中的发言人进行定位跟踪可以更详细的了解发言人的情况。目前,在一些场景进行录播时,录播主机的主机与摄像模块是分离的,往往需要通过其它的布线来实现摄像头与主机之间的信息传递。如果场景中的发言人移动位置,那么就需要调整摄像头角度,以实现对发言人的跟踪,常用的基于麦克风阵列的声源定位技术可以根据声学定位技术估计出发言人的方位并自动调整摄像头角度,保持对发言人的跟踪,但是这种方法的测向误差较大。故,现有技术中的录播主机测向跟踪能力不足,并且集成化程度较低,导致实际生产中成本较高。
技术实现思路
本专利技术的目的是提供一种录播主机、声源定位方法及装置,以解决录播主机集成化程度低以及测向跟踪能力差的问题。本专利技术的目的是通过以下技术方案实现的:本专利技术一方面提供一种录播主机,包括:音频处理模块、设置在机体上的声音传感器和自由转动式摄像头,其中:所述声音传感器用于采集声音信号;所述音频处理模块用于获取所述声音传感器采集的声音信号,依据所述声音信号确定目标声源信号,并确定所述目标声源信号的声源方向信息,将所述声源方向信息发送给所述自由转动式摄像头;所述自由转动式摄像头用于接收所述音频处理模块发送的声源方向信息,并调整摄像头角度为所述声源方向信息所指示的声源方向。可选的,所述音频处理模块采用如下方式依据所述声音信号确定目标声源信号:确定所述声音传感器所采集的声音信号在时域上对应统计量的计算值,所述统计量包括过零率、长短时能量以及自相关函数,其中,所述声音传感器包括第一声音传感器和第二声音传感器;将所述统计量的计算值与预先设定的阈值进行比较,确定所述第一声音传感器所采集的声音信号中是否包含目标声源信号语音信号,以及所述第二声音传感器所采集的声音信号中是否包含语音信号目标声源信号,其中,所述目标声源信号为目标人物所发出的声音信号;若确定所述第一声音传感器和所述第二声音传感器中的至少一个所采集到的声音信号中包含有语音信号目标声源信号,则将所述第一声音传感器和所述第二声音传感器所采集到的语音信号目标声源信号确定为目标声源信号。可选的,所述音频处理模块采用如下方式确定所述目标声源信号的声源方向信息:将所述目标声源信号对应的时域信号转换为频域信号,并将所述频域信号所在频段划分为至少两个子频段;针对所述划分的至少两个子频段中的每个子频段,分别确定该子频段上的频域信号到达所述第一声音传感器和到达所述第二声音传感器的声程差,并根据所述声程差以及所述第一声音传感器和所述第二声音传感器之间的间距,确定该子频段上频域信号的声源方位估计值;对所述至少两个子频段中的每个子频段确定出的声源方位估计值进行加权,得到加权方位估计值;根据所述加权方位估计值,确定目标声源信号的声源方位估计值,并依据所述目标声源信号的声源方位估计值,确定所述目标声源信号的声源方向信息。可选的,根据所述加权方位估计值,确定目标声源信号的声源方位估计值,包括:根据当前时刻的加权方位估计值、前一时刻的加权方位估计值以及对前一时刻跟踪结果的加权值确定目标声源信号的声源方位估计值。本专利技术另一方面提供了一种声源测向的方法,包括:获取声音传感器所采集的声音信号;依据所述声音信号确定目标声源信号,并确定所述目标声源信号的声源方向信息。可选的,所述依据所述声音信号确定目标声源信号,包括:确定所述声音传感器所采集的声音信号在时域上对应统计量的计算值,所述统计量包括过零率、长短时能量以及自相关函数,其中,所述声音传感器包括第一声音传感器和第二声音传感器;将所述统计量的计算值与预先设定的阈值进行比较,确定所述第一声音传感器所采集的声音信号中是否包含目标声源信号,以及所述第二声音传感器所采集的声音信号中是否包含目标声源信号,其中,所述目标声源信号为目标人物所发出的声音信号;若确定所述第一声音传感器和所述第二声音传感器中的至少一个所采集到的声音信号中包含有目标声源信号,则将所述第一声音传感器和所述第二声音传感器所采集到的目标声源信号确定为目标声源信号。可选的,所述确定所述目标声源信号的声源方向信息,包括:将所述目标声源信号对应的时域信号转换为频域信号,并将所述频域信号所在频段划分为至少两个子频段;针对所述划分的至少两个子频段中的每个子频段,分别确定该子频段上的频域信号到达所述第一声音传感器和到达所述第二声音传感器的声程差,并根据所述声程差以及所述第一声音传感器和所述第二声音传感器之间的间距,确定该子频段上频域信号的声源方位估计值;对所述至少两个子频段中的每个子频段确定出的声源方位估计值进行加权,得到加权方位估计值;根据所述加权方位估计值,确定目标声源信号的声源方位估计值,并依据所述目标声源信号的声源方位估计值,确定所述目标声源信号的声源方向信息。本专利技术还提供了一种声源测向的装置,包括:获取单元,用于获取声音传感器所采集的声音信号;处理单元,用于依据所述获取单元获取到的声音信号确定目标声源信号,并确定所述目标声源信号的声源方向信息。可选的,所述处理单元具体用于按如下方式依据所述获取单元获取到的声音信号确定目标声源信号:确定所述声音传感器所采集的声音信号在时域上对应统计量的计算值,所述统计量包括过零率、长短时能量以及自相关函数,其中,所述声音传感器包括第一声音传感器和第二声音传感器;将所述统计量的计算值与预先设定的阈值进行比较,确定所述第一声音传感器所采集的声音信号中是否包含目标声源信号,以及所述第二声音传感器所采集的声音信号中是否包含目标声源信号,其中,所述目标声源信号为目标人物所发出的声音信号;若确定所述第一声音传感器和所述第二声音传感器中的至少一个所采集到的声音信号中包含有目标声源信号,则将所述第一声音传感器和所述第二声音传感器所采集到的目标声源信号确定为目标声源信号。可选的,所述处理单元具体用于按如下方式确定所述目标声源信号的声源方向信息:将所述目标声源信号对应的时域信号转换为频域信号,并将所述频域信号所在频段划分为至少两个子频段;针对所述划分的至少两个子频段中的每个子频段,分别确定该子频段上的频域信号到达所述第一声音传感器和到达所述第二声音传感器的声程差,并根据所述声程差以及所述第一声音传感器和所述第二声音传感器之间的间距,确定该子频段上频域信号的声源方位估计值;对所述至少两个子频段中的每个子频段确定出的声源方位估计值进行加权,得到加权方位估计值;根据所述加权方位估计值,确定目标声源信号的声源方位估计值,并依据所述目标声源信号的声源方位估计值,确定所述目标声源信号的声源方向信息。本专利技术提供的录播主机、声源测向的方法及装置中,通过声音传感器采集声音信号;音频处理模块获取声音传感器采集的声音信号,依据声音信号确定目标声源信号,并确定目标声源信号的声源方向信息,将声源方向信息发送给自由转动式摄像头;自由转动式摄像头接收音频处理模块发送的声源方向信息,并调整摄像头角度为声源方向信息所指示的声源方向,以解决录播主机集成化程度较低以及测向跟踪能力本文档来自技高网...
一种录播主机、声源测向的方法及装置

【技术保护点】
一种录播主机,其特征在于,包括:音频处理模块、设置在机体上的声音传感器和自由转动式摄像头,其中:所述声音传感器用于采集声音信号;所述音频处理模块用于获取所述声音传感器采集的声音信号,依据所述声音信号确定目标声源信号,并确定所述目标声源信号的声源方向信息,将所述声源方向信息发送给所述自由转动式摄像头;所述自由转动式摄像头用于接收所述音频处理模块发送的声源方向信息,并调整摄像头角度为所述声源方向信息所指示的声源方向。

【技术特征摘要】
1.一种录播主机,其特征在于,包括:音频处理模块、设置在机体上的声音传感器和自由转动式摄像头,其中:所述声音传感器用于采集声音信号;所述音频处理模块用于获取所述声音传感器采集的声音信号,依据所述声音信号确定目标声源信号,并确定所述目标声源信号的声源方向信息,将所述声源方向信息发送给所述自由转动式摄像头;所述自由转动式摄像头用于接收所述音频处理模块发送的声源方向信息,并调整摄像头角度为所述声源方向信息所指示的声源方向。2.如权利要求1所述的录播主机,其特征在于,所述音频处理模块采用如下方式依据所述声音信号确定目标声源信号:确定所述声音传感器所采集的声音信号在时域上对应统计量的计算值,所述统计量包括过零率、长短时能量以及自相关函数,其中,所述声音传感器包括第一声音传感器和第二声音传感器;将所述统计量的计算值与预先设定的阈值进行比较,确定所述第一声音传感器所采集的声音信号中是否包含目标声源信号,以及所述第二声音传感器所采集的声音信号中是否包含目标声源信号,其中,所述目标声源信号为目标人物所发出的声音信号;若确定所述第一声音传感器和所述第二声音传感器中的至少一个所采集到的声音信号中包含有目标声源信号,则将所述第一声音传感器和所述第二声音传感器所采集到的目标声源信号确定为目标声源信号。3.如权利要求2所述的录播主机,其特征在于,所述音频处理模块采用如下方式确定所述目标声源信号的声源方向信息:将所述目标声源信号对应的时域信号转换为频域信号,并将所述频域信号所在频段划分为至少两个子频段;针对所述划分的至少两个子频段中的每个子频段,分别确定该子频段上的频域信号到达所述第一声音传感器和到达所述第二声音传感器的声程差,并根据所述声程差以及所述第一声音传感器和所述第二声音传感器之间的间距,确定该子频段上频域信号的声源方位估计值;对所述至少两个子频段中的每个子频段确定出的声源方位估计值进行加权,得到加权方位估计值;根据所述加权方位估计值,确定目标声源信号的声源方位估计值,并依据所述目标声源信号的声源方位估计值,确定所述目标声源信号的声源方向信息。4.如权利要求3所述的录播主机,其特征在于,根据所述加权方位估计值,确定目标声源信号的声源方位估计值,包括:根据当前时刻的加权方位估计值和前一时刻的加权方位估计值,确定目标声源信号的声源方位估计值。5.一种声源测向的方法,其特征在于,包括:获取声音传感器所采集的声音信号;依据所述声音信号确定目标声源信号,并确定所述目标声源信号的声源方向信息。6.如权利要求5所述的方法,其特征在于,所述依据所述声音信号确定目标声源信号,包括:确定所述声音传感器所采集的声音信号在时域上对应统计量的计算值,所述统计量包括过零率、长短时能量以及自相关函数,其中,所述声音传感器包括第一声音传感器和第二声音传感器;将所述统计量的计算值与预先设定的阈值进行比较,确定所述第一声音传感器所采集的声音信号中是否包含目标声源信号,以及所...

【专利技术属性】
技术研发人员:乔刚潘武
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1