一种视频多尺度可视化方法与交互方法技术

技术编号：18783102 阅读：29 留言：0更新日期：2018-08-29 06:43

本发明专利技术公开了一种视频多尺度可视化方法与交互方法。本方法为：建立目标视频的面向视频内容结构的用户认知模型；提取出该目标视频中的前景对象、背景场景以及前景对象的图像帧；获取运动目标及其相应轨迹；根据基于时间轴的运动目标出现量及对应的时间映射关系计算运动目标的出现密度；从处理后的目标视频数据中提取关键帧，并对关键帧中的运动目标信息进行标注；将处理后的运动目标识别结果及运动目标的轨迹数据进行多尺度划分，生成多尺度的视频信息表示结构；基于用户在交互过程中的交互操作方式，在多尺度的视频信息表示结构的交互界面，结合鼠标交互操作的相应语义，引入草图交互手势；通过草图交互手势在该交互界面对该目标视频进行操作。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频多尺度可视化方法与交互方法
本专利技术属于人机交互领域，具体涉及一种视频多尺度可视化方法与交互方法。
技术介绍
视频是当今社会信息传播的重要载体，随着计算机软硬件技术的快速发展和数码设备的广泛普及，其数据量在日常生活中呈现出了爆炸式的增长趋势，如何快速地获取视频信息、与其进行高效交互进而有效利用这些视频信息具有巨大的应用价值。伴随着这些视频资源数量的急剧增加，用户基于内容的视频数据访问应用越来越广泛，对视频信息的呈现、编辑、浏览和检索等需求也越来越突出。然而，与这些视频数据如此巨大增幅相对应的则是人与这些信息之间的交互方式并没有随之发生根本性的转变，现有的视频数据分析与交互方法已严重制约着它的进一步发展。随着这些数据超出人脑高效处理信息的能力范围，如何帮助用户对视频信息的需求进行有效认知，支持用户对庞大的信息数据库进行快速浏览、分析、理解与高效交互已经成为了现阶段视频应用研究领域亟需解决的问题。用户对视频内容的理解是一个视频数据底层视觉特征信息与高层语义信息自然融合的过程。其中不同的用户对不同视频内容的理解过程与他们的认知方法、认知能力息息相关。如何提供有效的方法辅助用户对视频信息进行可视分析，高效地实现视频内容理解，是视频内容分析领域的一个重要研究课题，而这里所谓的有效方法的设计基础是要求其符合用户正常学习、使用的认知习惯。一般情况下，用户在浏览和理解一些信息内容的过程中，首先通常习惯在粗尺度上对这些数据内容进行总览，然后根据自己的喜好或目的有针对性地对特定的内容进行更精细尺度上的浏览。所以提取和表达不同尺度、不同层次上的内容信息可以帮助用户快速...

【技术保护点】
1.一种视频多尺度可视化方法，其步骤包括：1)建立目标视频的面向视频内容结构的用户认知模型；2)对该目标视频中的前景与背景进行分离，提取出该目标视频中的前景对象、背景场景以及前景对象的图像帧；基于帧间图像差分计算，获取运动目标及其相应轨迹；根据基于时间轴的运动目标出现量及对应的时间映射关系计算运动目标的出现密度；3)从步骤2)处理后的目标视频数据中提取关键帧，并对所提取出的关键帧中的运动目标信息进行标注；4)将步骤3)处理后的运动目标识别结果及运动目标的轨迹数据进行多尺度划分，然后以帧信息的可视化方式实时组织各设定尺度的可视化内容，生成多尺度的视频信息表示结构。

【技术特征摘要】
1.一种视频多尺度可视化方法，其步骤包括：1)建立目标视频的面向视频内容结构的用户认知模型；2)对该目标视频中的前景与背景进行分离，提取出该目标视频中的前景对象、背景场景以及前景对象的图像帧；基于帧间图像差分计算，获取运动目标及其相应轨迹；根据基于时间轴的运动目标出现量及对应的时间映射关系计算运动目标的出现密度；3)从步骤2)处理后的目标视频数据中提取关键帧，并对所提取出的关键帧中的运动目标信息进行标注；4)将步骤3)处理后的运动目标识别结果及运动目标的轨迹数据进行多尺度划分，然后以帧信息的可视化方式实时组织各设定尺度的可视化内容，生成多尺度的视频信息表示结构。2.一种视频多尺度交互方法，其步骤包括：1)建立目标视频的面向视频内容结构的用户认知模型；2)对该目标视频中的前景与背景进行分离，提取出该目标视频中的前景对象、背景场景以及前景对象的图像帧；基于帧间图像差分计算，获取运动目标及其相应轨迹；根据基于时间轴的运动目标出现量及对应的时间映射关系计算运动目标的出现密度；3)从步骤2)处理后的目标视频数据中提取关键帧，并对所提取出的关键帧中的运动目标信息进行标注；4)将步骤3)处理后的运动目标识别结果及运动目标的轨迹数据进行多尺度划分，然后以帧信息的可视化方式实时组织各设定尺度的可视化内容，生成多尺度的视频信息表示结构；5)基于用户在交互过程中的交互操作方式，在多尺度的视频信息表示结构的交互界面，结合鼠标交互操作的相应语义，引入草图交互手势；用户通过引入的草图交互手势在该交互界面对该目标视频进行操作。3.如权利要求1或2所述的方法，其特征在于，所述步骤4)中，依据该目标视频的多尺度划分结构进行多尺度划分；其中，得到该目标视频的多尺度划分结构的方法为：首先结合所述用户认知模型中的视频信息流向层对该目标视频进行划分，得到该目标视频的低层特征层、实体信息层、模式信息层和抽象语义层；然后将背景、前景及场景分割结果划分到实体信息层，将镜头内容划分到模式信息层，将空间关系、时间关系及对象关系划分到抽象语义层，得到该目标视频的多尺度划分结构。4.如权利要求1或2所述的方法，其特征在于，基于帧的变化量对所述目标视频进行分段处理，其方法为：首先，建立背景时，选择该目标视频帧中的一个帧作为背景帧，然后在一设定时间长度内的连续帧中取一个像素点，将该像素点的中值亮度作为背景帧的该点亮度值；即：其中B0(x，y)...

【专利技术属性】
技术研发人员：马翠霞，黄燕，王宏安，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人