由视频重放系统从压缩数字视频信号中动态地提取特征技术方案

技术编号:3614683 阅读:137 留言:0更新日期:2012-04-11 18:40
一种视频播放系统包括连接成接收输入的压缩数字视频信号的接收器。在接收输入的压缩数字视频信号时,与接收器相连接的编码器从输入的压缩数字视频信号中提取特征,并将所提取的特征编码成为内容描述符。与接收器相连接的搜索引擎根据内容描述符通过用户接口来访问所接收的输入压缩数字视频信号。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般说来涉及从压缩数字视频信号中提取特征,而更具体地说,涉及使用所提取的特征来访问视频信号的内容。近来提出了许多关于传送可视信息的标准。对于视频信号,最广泛采用的标准包括MPEG-1(用于运动图象的存储和检索),MPEG-2(用于数字电视)以及H.263,参见ISO/IEC JTC1 CD 11172,MPEG,“信息技术-用于数字存储媒体速率高达大约1.5兆位/秒的运动图象及其伴音的编码-第二部分运动图象信息的编码”,1991;LeGall,“MPEG多媒体应用的视频压缩标准”,ACM通信,第34卷,第四分册,第45-58页,1991;ISO/IEC DIS 13818-2,MPEG-2,“信息技术-运动图象及其伴音信息的通用编码-第二部分视频”,1994;ITU-T SG XV,DRAFT H.263,“用于低位率通信的视频编码”,1996;ITU-T SG XVI,DRAFT13 H.263+Q15-A-60rev.0,“用于低位率通信的视频编码”,1997。这些标准相对来说是低级的规范,主要涉及到视频信号的时间和空间压缩。这些标准具有一个共同特征它们都是以每帧为基础进行压缩。采用了这些标准,可以在广泛的应用范围内获得高的压缩率。较新的视频编码标准,例如MPEG-4(用于多媒体应用),参见“信息技术-音频/可视对象的通用编码”,ISO/IEC 14496-21999(MPEG4Visual),允许将任意形状的对象作为独立的视频对象平面(VOP)和帧组(GOF)来进行编码和解码。这些对象可以是可视、音频、天然、人工合成、原始、复合等形式或者上述形式的组合。这个新兴的标准用来实现多媒体应用,如交互式视频,其中集成了天然及人工合成材料,而且Internet也为其提供了通用访问的方法。例如,人们可能想将一个运动图象或对象从一段视频中“剪切并粘贴”到另一段视频中。在这种应用中,假定多媒体内容中的对象已经被某种分割方法所识别,如参见序列号为09/326,750的美国专利申请“对图象空间进行排序以搜索对象表面的方法”,1999年6月4日由林(Lin)等人申请。附图说明图1示出高层的传统视频重放系统100。重放系统100包含一个视频接收器/解码器/显示器(以下称作“接收器”200)。接收器200连接到用户接口120,如远程控制器、键盘或鼠标。压缩数字输入位流101形式的视频节目101来自存储设备、摄像机,或者通过广播频道接收。接收器200接收该输入位流,对其进行解码,最后再将已解码的图象向用户102显示。显示器可以是电视或电脑终端。在先有技术中,所允许的对本地视频内容的访问相对比较简单。用户接口提供有限的一组命令来遍历(“访问”)视频的内容,例如快进、播放以及回退等。如果该内容存储在DVD上,那么就能够进行随机访问。无论如何,用户的访问都是以该视频中帧的位置为基础的,其中所述位置或者由时间或者由帧对该视频开头的偏移量来确定。访问视频时并不考虑该视频的内容。如果不知道内容,就很难为用户提供访问该内容的先进方法。例如,如果用户想要跳进到视频中一场赛事的得分镜头部分,那么仅有快进、播放以及回退等命令则难于实现。这样有限的一组位置访问命令只能允许用户在视频中确定所需的位置。目前的视频重放系统不支持基于内容的访问。基于内容的访问需要对视频进行一些预先分析,以便确定并定位特定用户感兴趣的部分。某些重放系统可能具有极为有限的基于内容的访问功能,例如,可以为所需的特定帧做标记或注释,所标记的帧的位置和注释可以存储在内存中。那么用户以后就可以跳进到以前所标记的帧进行重放。但是,提供这种视频注释功能的系统通常不能与其它设备协同操作,而且还要求用户进行大量的操作。也就是说,用户必须查看这些帧,并选取所需的特定帧。因此,先有技术的视频重放系统和用户就受到限制,只能共同参与定位。换句话说,用户必须即时访问该内容。在内容放置在远端的情况下,先有技术系统通常不允许基于内容的访问。例如,通过Web浏览器和Internet对存储在远程服务器上的视频数据进行访问的用户。将来,基于内容的访问以及可交换的重放系统将是一个必须支持的关键特征。以可交换的方式对基于内容的访问的支持将需要描述该内容的元数据。先有技术的接收器200的详细结构在图2中给出。解码发生在两个基本阶段。在第一阶段,从压缩的视频中提取特征,并且在第二阶段,所提取的特征被用来重组视频。为了支持基于内容的访问,本专利技术(如下所述)采用不同的方式进行解码。多路分离器(demux)210接收压缩的位流101。该多路分离器与所接收的位流数据包同步,并将位流中的视频、音频以及数据部分分离成各原始位流。利用内存控制器230将压缩数据发送到共享内存单元220。前端分析程序240对压缩视频进行分析。分析程序240负责提取位流的高层语法,例如,在MPEG-2标准的片层之上。在此等级之下,位被传送到符号处理器250,该符号处理器主要负责可变长解码(VLD)运算。例如,在MPEG位流中,运动矢量和离散余弦变换(DCT)系数通过可变长编码连同其它信息(如宏块方式等)进行编码。经过符号处理器,宏块(MB)和运动矢量(MV)信息251被发送到地址生成器260,同时DCT信息252被发送到反向DCT(IDCT)270。地址生成器负责生成内存地址,该地址将用于在内存单元220中写入和读取视频数据。地址生成器在很大程度上要依靠诸如预测方式、当前块的位置以及运动矢量值等信息。某些信息被传递到运动补偿单元280,此单元把从内存单元中读取的数据与从IDCT 270接收的数据进行组合。在帧内方式预测的情况下,由于从内存中读取的数据属于预测性信息,就可能没有从内存中读取的数据。重组的数据将从运动补偿单元280写入到内存220中。要显示此数据时,显示处理器290读取该数据以便进行任何所需的处理。用户接口120与内存控制器230相互配合,从而能够实现如上所述的有限的位置访问。MPEG委员会最近进行的标准化工作就是关于MPEG-7,命名为“多媒体内容描述接口”,参见“MPEG-7环境、目标以及技术说明”,ISO/IEC N2861,1999年7月。该标准主要是计划加入一套描述符和描述方案(DS),它们可以用于描述各种类型的多媒体内容。描述符和描述方案与内容本身相关联,并允许对特定用户感兴趣的内容进行快速及有效的检索。重要的是要认识到,MPEG-7标准并不是要取代以前的编码标准。相反,它是基于以前的标准方案的,尤其是MPEG-4,这是因为多媒体内容可以分解为不同的对象,而且可以给每个对象指定一套唯一的描述符。同时,该标准与存储内容的格式无关。MPEG-7的主要应用将是在搜索和检索应用方面,参见“MPEG-7应用”,ISO/IECN2861,1999年7月。在简单的应用环境中,用户指定一个特定对象的某些属性。在该低级表示法,这些属性可以包含描述该特定对象的结构、运动及形状等的描述符。一种表示和比较形状的方法在序列号为09/326,759的美国专利申请“对图象空间进行排序以表示对象形状的方法”中进行了说明,该专利由林(Lin)等人于1999年6月4日申请,另外,一种描述运动活动性的方法在序列号为09/406,444本文档来自技高网...

【技术保护点】
一种用于处理输入的压缩数字视频信号的视频重放系统,它包括: 接收器,连接成接收所述输入的压缩数字视频信号; 特征提取单元,与所述接收器相连接,用于从所述输入的压缩数字视频信号中动态地提取特征; 描述方案例示程序,与所述特征提取单元相连接,用于在接收所述输入的压缩数字视频信号时,将所述提取的特征编码成为内容描述符。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:A维特罗A迪瓦卡兰H孙浅井光太郎西川博文关口俊一村上笃道守屋芳美
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1