为视频添加立体标签的方法技术

技术编号:37570957 阅读:11 留言:0更新日期:2023-05-15 07:49
本发明专利技术提供一种为视频添加立体标签的方法,其特征在于,包括:提取摄像头所摄视频的三维坐标系信息;根据用户在屏幕的选择点确定标签的三维坐标;将所述摄像头所摄视频与所述标签进行合成。本发明专利技术为视频添加动态立体标记的方法,能实现对视频中的物体进行带有纵深感的、具有立体效果的动态标识,从而有利于视频观看者快速捕捉所关注的信息,在广告、导游、教学等等领域均有极高商业价值。学等等领域均有极高商业价值。学等等领域均有极高商业价值。

【技术实现步骤摘要】
为视频添加立体标签的方法


[0001]本专利技术涉及一种视频处理技术,尤其涉及一种在视频中添加动态的3D标记的方法。

技术介绍

[0002]随着计算机技术和网络技术的发展,网速越来越快、终端的处理能力越来越强,基于视频的应用也越来越普及。但另一方面,视频的信息承载量大,而如今人们的生活节奏又越来越快,因此如果能在一段视频中对不同的事务进行标记,有利于对观看者进行提示,辅助观看者迅速筛选信息,并且能加深印象。广告、教学、旅游景点介绍等场景下都有这样的需求。
[0003]目前对视频进行标记的主要方式,主要是靠视频后期编辑人员通过添加2D文字标签完成。这种做法的缺点比较明显:2D文字标签本身没有办法随着其所标识的物体变化而变化,当标签较为密集时,容易产生堆叠影响辨识。而且当观察者(摄像头)位置、角度发生变化时,2D标签没有办法随着其所标识的物体做相应的变化,导致观看着体验差。
[0004]因此如果能利用拍摄设备,在拍摄视频时,就直接为提供添加3D标签的功能,避免大量视频后期编辑工作,同时改善标签的视觉体验成为及待解决的问题。

技术实现思路

[0005]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种为视频添加立体标签的方法,其特征在于,包括:提取摄像头所摄视频的三维坐标系信息;根据用户在屏幕的选择点确定标签的三维坐标;将所述摄像头所摄视频与所述标签进行合成。
[0006]优选地,上述为视频添加立体标签的方法中,提取摄像头所摄视频的三维坐标系信息的步骤中,包括利用视觉惯性系统和惯性导航系统对所述摄像头进行定位的步骤。
[0007]优选地,上述为视频添加立体标签的方法中,所述确定标签的三维坐标的步骤中,包括:根据所述选择点的屏幕横、纵坐标,以及默认的初始Z轴坐标设置所述标签的初始三维坐标;根据摄像头相对于所述三维坐标的位置变化改变所述初始三维坐标;根据所述用户的确认指令确认所述标签的三维坐标。
[0008]优选地,上述为视频添加立体标签的方法中,所述确定标签的三维坐标的步骤中,包括:根据所述选择点的屏幕横、纵坐标,以及默认的初始Z轴坐标设置所述标签的初始三维坐标;根据用户输入更改所述标签的Z轴坐标;根据所述用户的确认指令确认所述标签的三维坐标。
[0009]优选地,上述为视频添加立体标签的方法中,所述根据用户输入更改所述标签的Z轴坐标的步骤中,当所述用户输入为长按所述标签时,所述标签的Z轴每毫秒增加Δz;当所述用户输入为双击所述标签时,每次双击所述标签的Z轴坐标减少Δz。
[0010]优选地,上述为视频添加立体标签的方法中,所述根据用户输入更改所述标签的Z轴坐标的步骤中,当所述用户输入为长按所述标签时,所述标签的Z轴每毫秒增加Δz;当所
述用户输入为连击所述标签时,每次连击所述标签的Z轴坐标减少Δz。
[0011]优选地,上述为视频添加立体标签的方法中,所述确定标签的三维坐标的步骤中,包括:识别所述抉择点上的物体,并将所述物体的三维坐标作为所述标签的初始三维坐标。
[0012]优选地,上述为视频添加立体标签的方法中,所述将所述摄像头所摄视频与所述标签进行合成的步骤还包括视觉校准、惯性校准的步骤。
[0013]本专利技术为视频添加动态立体标记的方法,能实现对视频中的物体进行带有纵深感的、具有立体效果的动态标识,从而有利于视频观看者快速捕捉所关注的信息,在广告、导游、教学等等领域均有极高商业价值。
附图说明
[0014]图1所示为本专利技术一种实施方式的流程图;
[0015]图2所示为图1实施例中所使用的镜头本地坐标系示意图。
具体实施方式
[0016]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。
[0017]图1所示为本专利技术一种实施方式的流程图。步骤S1表示提取摄像头所摄视频的三维坐标系信息。要体现标识的纵深和立体效果,应当确定所标识物体在坐标系中的空间坐标(三维坐标)。但坐标系具有相对性,三维坐标系可以有世界坐标(绝对坐标)系、本地坐标系。视频通常是由摄像设备对真实世界进行摄录形成,因此视频体现的实际是以镜头为原点、被摄物体与镜头间的相对位置和方向,也即视频内容采用的相当于镜头的本地坐标系。
[0018]识别坐标系就必须要解决定位问题。视频拍摄的定位更接近室内定位问题,无法使用GPS、北斗等导航系统实现世界坐标系中的定位。视频拍摄的定位问题解决的是摄像机本身的6自由度姿势(指xyz三个方向上的移动加上俯仰/偏转/滚动),以及与被摄物体、环境之间的相对位置关系。解决视频拍摄定位问题的方式是综合运用视觉惯性系统和惯性导航系统。
[0019]视觉惯性系统是利用摄像头拍摄的连续帧为输入,识别出每一帧图像中的特征点,并且根据特征点在连续的图像帧之间的位置变化来识别摄像头的位置和姿势。惯性导航系统是利用加速度计和陀螺仪等惯性测量单元的连续读数,来计算摄像头的姿势和位置变化,结合两种系统的计算结果(例如使用卡尔曼滤波器),可以优化摄像头定位的准确性。假设本例中镜头的本地坐标系如图2所示,其中原点C代表摄像头,平面S代表与Z轴垂直、与屏幕平行的平面。以下如无特别说明,三维坐标也均指图2所示坐标。目前已经有了一些工具可以完成类似的工作,例如苹果公司的ARKit工具、谷歌公司的ARCore等。
[0020]步骤S2表示确定标签的三维坐标。以手机拍摄视频场景为例,3D标签的位置是通过用户点击手机屏幕确定的。但屏幕是一个二维系统,因此用户的点选只能得到一个屏幕坐标系下的二维坐标(x1,y1),将这个二维坐标(x1,y1)转换成三维坐标后,才能作为3D标签的位置。坐标(x1,y1)与镜头坐标系中的横、纵坐标可视为一一对应关系,因此转换较为
简单,不予赘述。主要是Z轴坐标的确定,通常标签位置的Z轴坐标可以通过接收用户的调整指令和确认指令来实现。具体有以下几种实施方式:
[0021]方案一:首先设置一个默认的Z轴坐标z1,将(x1,y1,z1)作为标签的初始三维坐标;同时也将标签设置为该三维坐标上的静止物体,第二步,用户通过移动摄像头调整摄像头相对于该“静止”标签的相对位置,此时标签的三维坐标会随之改变。在操作上可以利用综合利用视觉惯性系统和惯性导航系统。第三步,当用户调整完摄像头与“静止”标签的相对位置后,接收用户发出的确认指令,将此时的三维坐标作为标签的最终三维坐标。
[0022]方案二:首先设置一个默认的Z轴坐标z1,将(x1,y1,z1)作为标签的初始三维坐标;第二步,监听用户输入,用户长按标签表示增加标签的z1坐标,双击表示减少标签z1的坐标。例如,当监听到用户长按时,标签的z1坐标每毫秒增加Δz;当监听到用户双击标签时,或者连击标签时,每双击一次将标签z1坐标减少Δz,或者每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种为视频添加立体标签的方法,其特征在于,包括:提取摄像头所摄视频的三维坐标系信息;根据用户在屏幕的选择点确定标签的三维坐标;将所述摄像头所摄视频与所述标签进行合成。2.根据权利要求1所述的为视频添加立体标签的方法,其特征在于,提取摄像头所摄视频的三维坐标系信息的步骤中,包括利用视觉惯性系统和惯性导航系统对所述摄像头进行定位的步骤。3.根据权利要求1所述的为视频添加立体标签的方法,其特征在于,所述确定标签的三维坐标的步骤中,包括:根据所述选择点的屏幕横、纵坐标,以及默认的初始Z轴坐标设置所述标签的初始三维坐标;根据摄像头相对于所述三维坐标的位置变化改变所述初始三维坐标;根据所述用户的确认指令确认所述标签的三维坐标。4.根据权利要求1所述的为视频添加立体标签的方法,其特征在于,所述确定标签的三维坐标的步骤中,包括:根据所述选择点的屏幕横、纵坐标,以及默认的初始Z轴坐标设置所述标签的初始三维坐标;根据用户输入更改所述标签的Z轴坐标;根据所...

【专利技术属性】
技术研发人员:李萌
申请(专利权)人:书行科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1