一种可定位视频数据采集与组织检索方法技术

技术编号:18458848 阅读:21 留言:0更新日期:2018-07-18 12:43
本发明专利技术公开一种可定位视频数据采集与组织检索方法,采集音视频的同时记录GPS定位信息、拍摄方位、摄像头参数形成可定位视频,并以MultiPoint空间要素描述视频帧与空间信息的关联关系,其中MultiPoint每个Point用于存储视频帧GPS定位信息、镜头朝向以及视频时间戳,在此基础上,结合拍摄参数构建视频帧二维可视域,并通过MultiPolygon描述视频帧的可视域进而构建可定位视频空间数据库,同时针对MultiPolygon字段建立空间索引,最终在GIS技术支持下实现基于可定位视频高效、精确的空间检索。本发明专利技术的视频检索结果更加精确,更符合人们的检索需求。

A location based video data acquisition and organization retrieval method

The invention discloses a method of locating video data collection and organization retrieval. It records GPS location information, location and camera parameters to form locable video simultaneously, and describes the relationship between video frames and spatial information with MultiPoint space elements, and each of the MultiPoint Point is used to store video frame G. On the basis of PS positioning information, lens orientation and video timestamp, the video frame is constructed by combining the shooting parameters and the visual domain of the video frame is described by MultiPolygon. The location of the video spatial database is constructed, and the space index is established for the MultiPolygon field. Finally, it is supported by the GIS technology. Efficient and accurate spatial retrieval based on locable video. The video retrieval results of the invention are more accurate and more in line with people's retrieval needs.

【技术实现步骤摘要】
一种可定位视频数据采集与组织检索方法
本专利技术涉及视频数据处理与地理信息科学领域,尤其涉及一种可定位视频数据采集与组织检索方法。
技术介绍
视频,作为一种公众媒体,已经成为日常生活中必不可少的信息载体,其应用领域日益广泛。面对飞速增长的海量视频数据,如何采取快速、高效的索引方式是视频数据处理领域的关键问题。自20世纪70年代以来,视频索引经历了基于文本索引与基于内容索引两种方式,其中文本索引是指通过人工提取视频关键信息,对视频的内容(如建筑、人物、事件等)进行语义层次上的描述,以关键字构建视频的索引,而基于内容的索引则根据视频的颜色、纹理、形状等特征进行索引。上述视频索引技术主要专注于视频主题、内容特征等方面,对于视频隐含的位置特征考虑较少,而在日常生活中,通常人们更关注“某某地方某某范围内拍摄的视频”、“某个路段沿线的视频”等之类的视频查询,并非简单的视觉特征查询需求。近年来,随着GPS、相机、传感器等硬件设备的飞速发展,诸多学者在视频与GPS定位信息、方位信息的融合以及基于位置视频检索进行了大量的研究。在视频与GPS位置融合采集方面,主要有以下四种融合方案:(1)GPS信息与视频的叠加方案,通过一个电路控制的同步字符发生器将转换后的模拟GPS信号以点阵数据脉冲的方式叠加到视频信号的适当位置以实现两者的融合;(2)GPS信息调制到音频信道,其通过专用信号调制解调设备接收GPS信号,并对GPS信号进行解析以获取空间位置、运动方向等参数,然后将解算后的GPS参数转换为模拟信号调制到音频载频中,完成与模拟视频信号的合成;(3)以时间为纽带,实现视频和GPS信息的关联。这是目前最为常用的一种融合方法,如Hwang(2003)利用MPEG-7对视频帧与空间位置关系进行描述;Navarrete等(2006)通过视频片断的地理索引,将分开存储的视频影像与地理空间定位信息相结合,生成能在地理环境中调用的超视频(Hypervideo);孔云峰(2009)通过建立专门的元数据描述特定视频帧与地理位置的对照关系,并使用插值方式获得所有视频帧的空间位置,将分离采集的视频、GPS定位信息联系起来生成地理视频数据(GeoVideo);以及加拿大卡尔加里大学、武汉大学、南京师范大学开发的移动测量系统(MMS)都是基于视频与空间信息关联的方法;(4)基于ASF容器融合方式,使用ASF流媒体文件作为编码容器,将视频信息、音频信息和定位信息进行实时融合,实现定位信息的自动无损嵌入,避免了空间信息的再编码,使视频带有定位功能;(5)专利CN101547360《可定位视频文件格式及该格式文件数据的采集方法》提出了一种可定位视频文件格式,支持视频信息、音频信息以及空间定位信息三者融为一体,便于后期视频基于空间定位信息的快速检索。在可定位视频检索方面,目前主要将视频采集路径抽象为线状数据,并采用空间网格方式进行索引,最终通过地图位置与视频采集路径之间的交集实现可定位视频的检索。具体步骤为:1)循环提取可定位视频每一视频帧对应的GPS定位信息,并在数据库中生成一条线记录信息,视频作为线的属性存储在该条记录中;2)采用空间索引对数据库中线记录集进行组织;3)用户在电子地图上框选视频查询范围,4)在空间索引支持下,基于查询范围筛选出初步视频片段集,再遍历初选视频片段集记录判断检索区域内的线段;5)返回位于检索区域内的视频片段数据集。目前可定位视频数据采集与检索方法缺点在于:(1)在数据采集方面,上述可定位视频采集方式重点关注于视频与GPS位置时间同步传输与显示问题,对于视频数据后期如何快速地、便捷地构建空间索引,实现基于位置的视频高效检索考虑较少;同时未充分考虑视频拍摄参数信息,例如镜头焦距、镜头可视角度、镜头放大倍数、镜头朝向等参数,仅考虑了GPS定位信息。(2)在数据组织方面,可定位视频拍摄场景实际上反映的是线性面状区域,而目前组织方式仅简单的根据拍摄视频所对应的GPS轨迹抽象为线模型,采用以线代面的检索方式会造成只能检索到拍摄位置位于检索范围内的视频片段,而一些虽然拍摄位置在区域外,但是实际上拍摄场景在检索范围内的视频片段出现漏检。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种可定位视频数据采集与组织检索方法。本专利技术采用的技术方案是:一种可定位视频数据采集与组织检索方法,其包括以下步骤:步骤1:采集获取可定位视频数据:可定位视频数据包括视频信息、音频信息、GPS位置信息、镜头朝向、拍摄参数,其中GPS定位信息、镜头朝向、视频帧时间戳使用MultiPoint格式进行组织,MultiPoint形式为:(((经度0纬度0方位0时间戳0),(经度1纬度1方位1时间戳1),…,(经度n纬度n方位n时间戳n)));步骤2:基于可定位视频数据构建视频帧的二维视域模型,二维视域模型由镜头视点、镜头朝向、可视角度、拍摄距离四个参数决定。二维视域模型各个参数计算方法如下:(1)镜头视点:以可定位视频数据的视频帧GPS经纬度值作为视点位置;(2)镜头朝向:以可定位视频数据的视频帧镜头朝向作为镜头中心朝向;(3)可视角度:针对定焦方式拍摄的视频,其可视角度为可定位视频数据的镜头初始可视角度值;(4)拍摄距离:利用感光元件成像宽度、镜头焦距与可视距离之间的比例关系确定图像的可视距离;基于公式1计算图像的极限可视距离作为该图像的可视距离。其中Distance为图像可视距离,SensorWidth为感光元件宽度,FocalLen为镜头焦距,Ratio为单位尺寸物体宽度所占图幅的比例,ObjectWidth为物体的实际宽度,SensorWidthZom为变焦后感光元件成像宽度;当视频未发生缩放,感光元件宽度SensorWidth由公式2计算得到,其中ViewAngle为可视角度;当视频发生缩放则需要除以缩放倍数如公式3所示。其中ScaleFactor为缩放倍数,其中SensorWidth取值由ScaleFactor决定;步骤3:遍历MultiPoint中所有Point,计算得到视频序列帧可视域并存储为MultiPolygon格式,同时建立视频空间数据库;其中MultiPolygon格式为:(((经度0纬度0方位0时间戳0,经度0’纬度0’,经度0”纬度0”,经度0纬度0)),((经度1纬度1方位1时间戳1,经度1’纬度1’,经度1”纬度1”,经度1纬度1)),…,((经度n纬度n方位n时间戳n,经度n’纬度n’,经度n”纬度n”,经度n纬度n)));步骤4:对视频空间数据库中空间类型MultiPolygon字段构建空间索引,根据视频可视域多面图形分布的范围确定索引边界、分割索引区域空间,并基于分割区域与可视域多面图形的空间关系确定索引坐标,进而建立视频可视域的空间索引;步骤5:在地图上框选视频检索区域,从空间索引的区域块筛选出与检索区域相交区域块内的视频片断集合作为初级过滤结果集;将检索区域与空间索引的区域块进行相交判断;获取与检索区域相交的空间索引的区域块,然后根据视频可视域与空间索引的区域块之间的索引关系,快速筛选出相交区域块内的视频片断集合作为初级过滤结果集;步骤6:逐一判断初级过滤结果集的视频帧可视域是否与检索区域相交;剔除与检索区域不相交的视本文档来自技高网
...

【技术保护点】
1.一种可定位视频数据采集与组织检索方法,其特征在于:其包括以下步骤:步骤1:采集获取可定位视频数据:可定位视频数据包括视频信息、音频信息、GPS位置信息、镜头朝向、拍摄参数,其中GPS定位信息、镜头朝向、视频帧时间戳使用MultiPoint格式进行组织,步骤2:基于可定位视频数据构建视频帧的二维视域模型,二维视域模型包括镜头视点、镜头朝向、可视角度、拍摄距离四个参数;步骤3:遍历MultiPoint中所有Point,计算得到视频序列帧可视域并存储为MultiPolygon格式,同时建立视频空间数据库;步骤4:对视频空间数据库中空间类型MultiPolygon字段构建空间索引,步骤5:在地图上框选视频检索区域,从空间索引的区域块筛选出与检索区域相交区域块内的视频片断集合作为初级过滤结果集;步骤6:逐一判断初级过滤结果集的视频帧可视域是否与检索区域相交;剔除与检索区域不相交的视频帧,并将与检索区域相交的视频帧并入视频检索结构集,视频检索结构集的视频返回给用户。

【技术特征摘要】
1.一种可定位视频数据采集与组织检索方法,其特征在于:其包括以下步骤:步骤1:采集获取可定位视频数据:可定位视频数据包括视频信息、音频信息、GPS位置信息、镜头朝向、拍摄参数,其中GPS定位信息、镜头朝向、视频帧时间戳使用MultiPoint格式进行组织,步骤2:基于可定位视频数据构建视频帧的二维视域模型,二维视域模型包括镜头视点、镜头朝向、可视角度、拍摄距离四个参数;步骤3:遍历MultiPoint中所有Point,计算得到视频序列帧可视域并存储为MultiPolygon格式,同时建立视频空间数据库;步骤4:对视频空间数据库中空间类型MultiPolygon字段构建空间索引,步骤5:在地图上框选视频检索区域,从空间索引的区域块筛选出与检索区域相交区域块内的视频片断集合作为初级过滤结果集;步骤6:逐一判断初级过滤结果集的视频帧可视域是否与检索区域相交;剔除与检索区域不相交的视频帧,并将与检索区域相交的视频帧并入视频检索结构集,视频检索结构集的视频返回给用户。2.根据权利要求1所述的一种可定位视频数据采集与组织检索方法,其特征在于:所述MultiPoint形式为:(((经度0纬度0方位0时间戳0),(经度1纬度1方位1时间戳1),…,(经度n纬度n方位n时间戳n)))。3.根据权利要求1所述的一种可定位视频数据采集与组织检索方法,其特征在于:二维视域模型各个参数计算方法如下:(1)镜头视点:以可定位视频数据的视频帧GPS经纬度值作为视点位置;(2)镜头朝向:以可定位视频数据的视频帧镜头朝向作为镜头中心朝向;(3)可视角度:针对定焦方式拍摄的视频,其可视角度为可定位视频数据的镜头初始可视角度值;(4)拍摄距离:利用感光元件成像宽度、镜头焦距与可视距离之间的比例关系确定图像的可视距离。4.根据权利要求3所述...

【专利技术属性】
技术研发人员:吴勇童为民林月煌郑森源
申请(专利权)人:福建师范大学
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1