通过实时视频动作分析理解视频内容制造技术

技术编号：2946475 阅读：233 留言：0更新日期：2012-04-11 18:40

描述了一种用于相机运动分析和移动对象分析的方法和集成系统，和主要从没有镜头变化的视频和视频段中的相机运动参数提取语义的方法。这样的视频的典型例子是由数码相机拍摄的家庭视频和专业视频或电影的一个片段或剪辑。提取的语义能够直接地用于多个对视频／图像的理解和管理应用中，例如评注、浏览、编辑、帧增强、关键帧提取、全景生成、打印、检索、汇总。还描述了不依赖于对象的先验知识的检测和跟踪运动对象的自动方法。此方法能够实时地执行。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】背景视频运动分析，包括相机运动分析和对象运动分析，是理解视频内容的重要部分，并且，内容理解在许多多媒体系统(包括个人计算机PC，数字娱乐系统，相机和甚至打印机)中的视频浏览、检索、编辑、打印等之中扮演着十分重要的角色。目前，打印机适于表现平面(二维)的媒体内容，诸如文档和图像，但视频打印尚属劳动密集型问题，因为三维(3-D)信号(也就是两个空间维度和一个时间维度)，视频包括更多具有相当大量的冗余的信息，这些不能被诸如纸张的静态媒体简单地表现出来。视频打印的一个方法是从视频剪辑(video clip)中选择关键帧，并打印这些选中的关键帧。不幸的是，关键帧提取的任务不是微不足道地自动完成的，因为，选取具有最大语义含义的关键帧是困难的计算机视觉和人工智能问题。问题的解决受到限制，因为通常能够令人接受的是仅打印合理数目的关键帧。关键帧可以通过对低层次的内容特征(例如，颜色、纹理、运动等)的分析来进行抽取。现有的运动分析和内容理解的方法不能够一般性地满足所有类型的视频(例如，家庭视频和专业视频，短视频剪辑和长视频记录等)，或者对于普通处理系统(诸如PC和类似相机的嵌入系统)来说太慢。现有方法通常设计用于专用任务，例如，跟踪人的运动(利用已知面部模型)或者车的运动(利用预定义的汽车模型)，并且，具有相应的简化和有限的能力。
技术实现思路
在一个方面，本专利技术是估计在连续图像对之间的相机运动的方法，包括从该对连续图像确定运动向量，和基于运动向量估计相机运动的仿射模型。运动向量的确定包括将该对连续图像之一分割为多个像素块；选择对应图像中至少一个特征的块；确定对应于各所选块的...

【技术保护点】
一种在连续图像对之间估计相机运动的方法，包括如下步骤：从连续图像对确定运动向量由如下步骤完成：将连续图像对中的一个图像分割成多个像素块（７０２）；选择对应于图像中至少一个特征的块（７０４）；确定对应于相应的选中的块的亮度值（７０６）；基于亮度值将选中的块与连续图像对儿中另外一个图像中的像素块进行匹配（７０８）；并且确定关联连续图像对中的匹配块的运动向量（７１０）；并且，基于运动向量估计相机运动的仿射模型，其中，估计出的仿射模型确定相机运动参数的集合（７１２）。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：T张，Y王，DR特雷特，
申请(专利权)人：惠普开发有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人