目标对象的定位方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32968612 阅读:31 留言:0更新日期:2022-04-09 11:29
本申请实施例提供一种目标对象的定位方法、装置、电子设备及存储介质,涉及计算机技术领域,能够在利用视频和音频配合定位的过程中,提升对目标对象定位的精度。方法包括:根据获取到的第一信息确定至少一个第一对象中每个第一对象在第一坐标系下的第一位置信息;根据映射关系以及每个第一对象的第一位置信息确定每个第一对象在第二坐标系下的第二位置信息,第一坐标系与第二坐标系不同;根据获取到的第二信息确定至少一个第二对象中每个第二对象在第二坐标系下的第三位置信息;根据每个第二对象的第三位置信息以及每个第一对象的第二位置信息确定目标对象,以对目标对象定位,目标对象为第三位置信息与第二位置信息匹配时对应的对象。配时对应的对象。配时对应的对象。

【技术实现步骤摘要】
目标对象的定位方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种目标对象的定位方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机技术的发展,目标定位作为视觉领域里重要的一环愈发受到重视。目前,基于计算机视觉的目标定位技术尤其是在人机交互方面正在逐渐改变人们的生活方式,并且广泛应用于监控、医疗影像、无人驾驶、远程控制、互动游戏等领域。在多媒体视频会议中,为了有效提升用户的观看体验,给用户带来良好的视觉效果,对目标对象(例如:会议中的发言人)进行定位,进行目标对象的特写,可以给用户带来更好的视觉感受和参会体验。
[0003]目前,可以利用视频(也可称之为图像)和音频结合的方式对目标对象进行定位,与仅利用音频定位(也可称之为声源定位)的方式相比,该方案可以有效的过滤其他噪声的影响,提高定位的精度。但是,在利用视频和音频配合定位的过程中,视频定位所采用的参考坐标系与音频定位采用的参考坐标系可能不同,使得视频定位确定的目标对象的位置信息与通过音频定位确定的目标对象的位置信息不同,二者不可配合使用,无本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标对象的定位方法,其特征在于,所述方法包括:根据获取到的第一信息确定至少一个第一对象中每个第一对象在第一坐标系下的第一位置信息;根据映射关系以及所述每个第一对象的所述第一位置信息确定所述每个第一对象在第二坐标系下的第二位置信息,所述映射关系为对象的第一位置信息和所述对象的第二位置信息之间的关系,所述第一坐标系与所述第二坐标系不同;根据获取到的第二信息确定至少一个第二对象中每个第二对象在所述第二坐标系下的第三位置信息;根据所述每个第二对象的所述第三位置信息以及所述每个第一对象的所述第二位置信息确定目标对象,以对所述目标对象定位,所述目标对象为所述第三位置信息与所述第二位置信息匹配时对应的对象;其中,所述第一信息为图像信息,所述第二信息为音频信息;或者,所述第一信息为音频信息,所述第二信息为图像信息。2.根据权利要求1所述的方法,其特征在于,所述第一位置信息为所述对象在所述第一坐标系下的第一水平方位角,所述第二位置信息为所述对象在所述第二坐标系下的第二水平方位角;所述根据映射关系以及所述每个第一对象的所述第一位置信息确定所述每个第一对象在第二坐标系下的第二位置信息,包括:根据所述每个第一对象的所述第一水平方位角、所述每个第一对象对应的z和/或x、所述每个第一对象对应的y确定所述每个第一对象的所述第二水平方位角;其中,若所述第一信息为图像信息,所述第二信息为音频信息,所述x为所述第一坐标系原点与所述第二坐标系原点之间的水平距离,所述y为所述第一对象与所述第一坐标系原点或者所述第二坐标系原点之间的垂直距离,所述z为所述第一对象与所述第二坐标系原点之间的水平距离;若所述第一信息为音频信息,所述第二信息为图像信息,所述x为所述第一坐标系原点与所述第二坐标系原点之间的水平距离,所述y为所述第一对象与所述第一坐标系原点或者所述第二坐标系原点之间的垂直距离,所述z为所述第一对象与所述第一坐标系原点之间的水平距离。3.根据权利要求2所述的方法,其特征在于,所述y的取值根据获取到的图像信息中的对象的目标区域的成像大小确定。4.根据权利要求2或3所述的方法,其特征在于,所述y的取值与获取到的图像信息中的对象的目标区域的成像大小负相关。5.根据权利要求2所述的方法,其特征在于,所述映射关系满足以下公式:其中,若所述第一信息为图像信息,所述第二信息为音频信息,则所述α1为所述第一水平方位角,且所述α1大于90
°
,所述β1为所述第二水平方位角;若所述第一信息为音频信息,所述第二信息为图像信息,则所述β1为所述第一水平方位
角,所述α1为所述第二水平方位角,且所述α1大于90
°
。6.根据权利要求2所述的方法,其特征在于,所述映射关系满足以下公式:其中,若所述第一信息为图像信息,所述第二信息为音频信息,则所述α1为所述第一水平方位角,且所述α1小于...

【专利技术属性】
技术研发人员:毛壮胡春波
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1