控制摄像头的方法、视频会议系统、电子设备和存储介质技术方案

技术编号:38941320 阅读:23 留言:0更新日期:2023-09-25 09:40
本发明专利技术公开了控制摄像头的方法、视频会议系统、电子设备和存储介质。该方法包括:获取与当前场景相关联的麦克风阵列所采集的声源信息;基于所述声源信息针对所述场景中的人员进行统计以得到声源统计信息;根据所述声源统计信息计算所述场景中的人员所在的场景区域;以及根据当前声源信息和所述声源统计信息控制与所述场景相关联的摄像头,使得所述摄像头的焦点在所述场景区域中根据所述当前声源信息而改变。本技术方案计算会议矩形区域能够得到会议全局信息,以保证会议全局图像的质量,而在当前声源信息有声音时将摄像头焦点切换至瞬时焦点,能够保证会议期间有发言的时候,及时根据发言情况进行摄像头调节,在切换近景时保证局部图像的质量。保证局部图像的质量。保证局部图像的质量。

【技术实现步骤摘要】
控制摄像头的方法、视频会议系统、电子设备和存储介质


[0001]本专利技术涉及机器视觉
,特别涉及控制摄像头的方法、视频会议系统、电子设备和存储介质。

技术介绍

[0002]目前,视频会议系统一般由远场语音采集、可旋转摄像头、会议机顶盒和大屏显示系统组成。远场语音采集负责声音采集,可旋转摄像头负责采集图像。会议机顶盒是视频会议系统的大脑,负责视频通话业务的全流程管理,负责输入和输出设备的管理等。但是,目前摄像头不能够根据语音采集数据进行灵活调整。

技术实现思路

[0003]本专利技术提供控制摄像头的方法、视频会议系统、电子设备和存储介质,其能够根据语音采集数据动态地对摄像头进行控制。
[0004]在本专利技术的一个方面,提供一种控制摄像头的方法。该方法包括:获取与当前场景相关联的麦克风阵列所采集的声源信息,基于所述声源信息针对所述场景中的人员进行统计以得到声源统计信息;根据所述声源统计信息计算所述场景中的人员所在的场景区域;以及根据当前声源信息和所述声源统计信息控制与所述场景相关联的摄像头,使得所述摄像头的焦点在所述场景区域中根据所述当前声源信息而改变。
[0005]在本专利技术的另一方面,提供一种视频会议系统。该系统包括麦克风阵列;至少一个摄像头;以及控制器,被配置为:获取所述麦克风阵列所采集的声源信息;基于所述声源信息针对会议中的人员进行统计以得到声源统计信息;根据所述声源统计信息计算所述会议中的人员所在的会议区域;以及根据当前声源信息和所述声源统计信息控制所述摄像头,使得所述摄像头的焦点在所述会议区域中根据所述当前声源信息而改变。
[0006]在本专利技术的又一方面,提供一种电子设备。该设备包括存储器,被配置为存储可执行程序;以及处理器,被配置为执行所述可执行程序以执行上述的控制摄像头的方法。
[0007]在本专利技术的再一方面,提供一种计算机可读存储介质。该介质上存储有计算机程序,所述计算机程序被处理器执行以实现上述的控制摄像头的方法。
[0008]根据本专利技术,从麦克风阵列获取到当前场景中的声源信息,基于声源信息针对场景中的人员进行统计以得到声源统计信息,并以此计算出场景中的人员所在的场景区域,根据当前声源信息和声源统计信息控制与场景相关联的摄像头,使得摄像头的焦点在场景区域中根据当前声源信息而改变。因此,结合当前声源信息和声源统计信息控制摄像头焦点的切换,能够保证根据场景中的声源情况及时进行摄像头调节。以此方式,使得摄像头能够根据麦克风采集到的声音数据动态地对摄像头进行控制,提高摄像头与麦克风采集数据的依赖性。
附图说明
[0009]图1为本专利技术实施例的控制摄像头的方法的流程图;图2为本专利技术实施例的基于声源信息计算会议场景焦点的流程图;图3为本专利技术实施例的基于声源信息控制摄像头参数的流程图;图4为本专利技术实施例的基于声音强度的摄像头平滑变焦方法的流程图;图5为本专利技术实施例的视频会议系统的框图;图6为本专利技术实施例的电子设备的框图。
具体实施方式
[0010]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。
[0011]在已有技术中,远程会议的语音采集与会议摄像头之间的关联性弱,摄像头不能够根据语音采集到的数据进行灵活动态地调整。
[0012]为了解决至少上述技术问题,本公开提供了控制摄像头的方法。根据本公开,从麦克风阵列获取到当前场景中的声源信息,基于声源信息针对场景中的人员进行统计以得到声源统计信息,并以此计算出场景中的人员所在的场景区域,根据当前声源信息和声源统计信息控制与场景相关联的摄像头,使得摄像头的焦点在场景区域中根据当前声源信息而改变。因此,结合当前声源信息和声源统计信息控制摄像头焦点的切换,能够保证根据场景中的声源情况及时进行摄像头调节。以此方式,使得摄像头能够根据麦克风采集到的声音数据动态地对摄像头进行控制,提高摄像头与麦克风采集数据的依赖性。
[0013]根据本公开的一些实施例,所述场景包括视频会议场景,并且所述场景中的人员包括参会者。然而,应当理解的是,根据本公开的场景不限于视频会议场景,在其他实施例中还可以包括使用麦克风阵列和摄像头的任何其他场景。
[0014]根据本公开的一些实施例,使用麦克风阵列的声源信息,使用统计的方法计算出最大会议矩形区域,并调整摄像头参数,以提升最大会议矩形区域的数字图像质量。基于瞬时的声源信息和声源统计信息计算会议场景的瞬时焦点,达到瞬时焦点的慢切换和延迟切换的效果,具有更好的用户体验。使用最大会议矩形区域和会议场景的瞬时焦点为依据调整摄像头参数。最大会议矩形区域保证了全局数字图像的高质量,会议场景的瞬时焦点保证了局部数字图像的高质量。
[0015]下文中,将参考具体实施例并且结合附图描述根据本公开的技术方案。
[0016]图1是示出根据本公开的实施例的一种控制摄像头的方法100的步骤示意图。参照图1,该方法100包括以下步骤102至步骤108。
[0017]在步骤102,获取与当前场景相关联的麦克风阵列所采集的声源信息。
[0018]在一些实施例中,获取包括声源方向、声源位置和声源强度中的至少一项的所述声源信息。在一些实施例中,当前场景可以包括视频会议场景。
[0019]在步骤104,基于所述声源信息针对所述场景中的人员进行统计以得到声源统计信息。
[0020]在一些实施例中,通过所述声源位置信息针对所述人员进行统计,并使用环形或先进先出队列存储统计的信息,以使用所述声源位置信息表征所述人员,其中位置方差在
一定范围内被判定为同一人员。此外,通过所述声源强度信息针对所述人员的活跃度进行统计, 并使用环形或先进先出队列存储统计的信息,以计算统计队列中的声源强度的平均值,以便表征所述人员的活跃度。以此方式,通过声源强度均值来确定人员的活跃度,便于后续结合活跃度进行摄像头焦点的切换。
[0021]在步骤106,根据所述声源统计信息计算所述场景中的人员所在的场景区域。
[0022]在一些实施例中,根据所述声源统计信息将声源位置为中心扩展得到矩形区域,所述矩形区域表征与所述声源位置相对应的人员所在的区域。此外,针对与多个人员相对应的矩形区域进行矩形组合操作以得到所述场景区域。在一些实施例中,控制所述摄像头使得所述摄像头的拍摄区域至少覆盖所述场景区域。以此方式,能够得到会议全局信息,以保证会议全局图像的质量。
[0023]在一些实施例中,根据声源统计信息中同一声纹特征的声源信息对应的位置信息,若所述位置信息的方差在预设范围内,则计算所述位置信息对应的最小第一矩形区域,并将所述第一矩形区域作为一人员所在的人员区域。以此方式,声源信息的位置方差在一定范围内即可判定为同一个人员。在一些实施例中,计算至少包含所有所述人员区域的最小第二矩形区域,将所述第二矩形区域作为场景区域。以此方式,能够得到会议全局信息,以保证会议全局图像的质量。
[0024]在步骤108,根据当前声源信息和所述声源统计信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种控制摄像头的方法,其特征在于,包括:获取与当前场景相关联的麦克风阵列所采集的声源信息;基于所述声源信息针对所述场景中的人员进行统计以得到声源统计信息;根据所述声源统计信息计算所述场景中的人员所在的场景区域;以及根据当前声源信息和所述声源统计信息控制与所述场景相关联的摄像头,使得所述摄像头的焦点在所述场景区域中根据所述当前声源信息而改变,包括:若所述当前声源信息满足阈值条件,则结合所述当前声源信息和所述声源统计信息计算所述场景中与所述当前声源信息相关联的瞬时焦点,以及将所述摄像头的焦点切换至所述瞬时焦点。2.根据权利要求1所述的方法,其特征在于,将所述摄像头的焦点切换至所述瞬时焦点包括:计算所述摄像头到所述场景的所述瞬时焦点的距离;以及控制所述摄像头的焦点通过平滑变焦过程切换到所述瞬时焦点。3.根据权利要求1所述的方法,其特征在于,根据当前声源信息和所述声源统计信息控制与所述场景相关联的摄像头使得所述摄像头的焦点在所述场景区域中根据所述当前声源信息而改变还包括:若所述当前声源信息未满足阈值条件,则根据所述声源统计信息控制所述摄像头的焦点在所述场景区域中的人员之间依次移动。4.根据权利要求3所述的方法,其特征在于,根据所述声源统计信息控制所述摄像头的焦点在所述场景区域中的人员之间依次移动包括:根据所述声源统计信息确定与所述场景中的人员相对应的权重值;以及根据所述权重值控制所述摄像头的焦点在所述场景区域中的人员之间平滑移动。5.根据权利要求1所述的方法,其特征在于,获取与当前场景相关联的麦克风阵列所采集的声源信息包括:获取包括声源方向、声源位置和声源强度中的至少一项的所述声源信息。6.根据权利要求5所述的方法,其特征在于,基于所述声源信息针对所述场景中的人员进行统计以得到声源统计信息包括:通过所述声源位置信息针对所述人员进行统计,并使用环形或先进先出队列存储统计的信息,以使用所述声源位置信息表征所述人员,其中位置方差在一定范围内被判定为同一人员;以及通过所述声源强度信息针对所述人员的活跃度进行统计,并使用环形或先进先出队列存储统计的信息,以计算统计队列中的声源强度的平均值,以便表征所述人员的活跃度。7.根据权利要求1所述的方法,其特征在于,根据所述声源统计信息计算所述场景中的人员所在的场景区域包括:根据所述声源统计信息将声源位置为中心扩展得到矩形区域,所述矩形区域表征与所述声源位置相对应的人员所在的区域;以及针对与多个人员相对应的矩形区域进行矩形组合操作以得到所述场景区域。8.根据权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:邱恩刘思妤
申请(专利权)人:瑞芯微电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1