用于处理嵌入在数字视频中的符号的系统和方法技术方案

技术编号:2928876 阅读:259 留言:0更新日期:2012-04-11 18:40
一种用于处理包括视频图像信息和至少一个符号的多媒体流的方法,包括:    从所述流中移去所述符号;以及    至少压缩所述视频图像信息以呈现压缩后的流。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术通常涉及多媒体传输。
技术介绍
为了节约带宽,在传输之前对通常包括视频帧的多媒体流进行压缩。压缩视频通常意味着用相对较小的位组来表示相对较大的位组。当一个或多个视频帧包含一个符号时,将表示符号的位和表示图像的位一起压缩,其中所述符号通常在这里用于指图形符号和字母-数字字符两者。即,当利用图形或字母-数字字符覆盖视频时,将原始(underlying)的图像和符号两者压缩到一起以进行传输。在接收后,对流进行解压缩以呈现原始图像的“有损”版本。本专利技术理解,当对多媒体的高效传输要求很高时,压缩和解压缩多媒体流经常导致一些数据损失。因此,原始流中的一些有用信息可能无法在解压缩后的流中重现。本专利技术还理解,在视频图像的情况下,由于观看者将不能在构成视频图像的相对大量的数据中发觉损失,因此少量信息的损失通常只有很小的后果。然而,本专利技术深刻地认识到符号通常并不需要大量数据来呈现。因此,在压缩/解压缩过程中少量符号信息的损失能够导致在解压缩后的符号中有可察觉的失真和/或赝象。此外,不得不将符号和与其有关联的图像一起压缩并传输,这会消耗多媒体传输带宽。除了上面的认识,本专利技术理解,通过无线链路将图像传输到便携式设备经常使分辨率的显著降低不可避免。降低的分辨率意味着只有较少的像素可用于表示一个符号。通常用于移动设备上的小显示屏限制了人类视觉系统(或HVS)容易且准确地辨别符号的能力。本专利技术理解,如果能够增大或转换显示在小屏幕上的视频中的符号,那么将提高HVS辨别符号的能力。考虑到这些观察结果,提供下述的本专利技术。
技术实现思路
一种用于处理图像的系统,包括执行逻辑的处理器,其中所述图像例如是具有符号的视频图像,所述符号例如是图形符号或字母-数字字符,所述逻辑包括扫描该图像。此外,处理器使用字符/符号识别技术来创建该符号的表示,然后对该图像进行压缩以呈现经过压缩的图像。在一个优选实施例中,由处理器执行的逻辑包括在压缩动作之前消除图像中的符号。或者,可以将符号与图像一起压缩。符号的表示不仅可以包括符号类型或标识,还可以包括其它描述性的参数,所述其它描述性的参数包括但不限于符号特征、符号位置、符号尺寸、符号字体及符号颜色。当系统包括发射处理器并且发射经过压缩的图像以及符号的表示时,系统还可以包括对经过压缩的图像进行解压缩以呈现解压缩后的图像的接收处理器。通过使用符号的表示,接收处理器能够将符号和解压缩后的图像合并。例如,接收处理器能够使用符号的位置来将符号或符号的转换版本插入到解压缩后的图像中。符号的表示可以被嵌入在经过压缩的流中,或者符号的表示从其中单独地发射出来。在另一方面,一种用于处理包括视频图像信息和视频中的符号的多媒体流的方法包括,从流中移去符号,然后压缩视频图像信息以呈现经过压缩的流。在又一个方面,接收处理器对经过压缩的视频流进行解压缩以呈现解压缩后的图像。通过使用已经包括在原始图像中的符号的表示,接收处理器将符号和解压缩后的图像合并。优选的非限定性的符号表示能够采用几种形式中的一种。例如,能够将符号的逐像素的位图表示嵌入在经过压缩的流中发送,例如在经过压缩的流的帧头中,或者能够在单独的流中传输位图。或者,也可以替代位图,以同样地方式传输表示符号的码字。在又一个方面,公开了一种用于处理具有符号的经过扫描的视频图像的计算机产品。所述产品包括用于识别经过扫描的图像中的符号以呈现符号信息的装置。然后装置压缩该图像。参照附图,能够最好地理解本专利技术关于其结构和操作两者的细节,在所有附图中,相同的标号表示相同的部件,其中附图说明图1是本专利技术的功能方框图;图2是压缩和发射逻辑的流程图;以及图3是能够使用的各种接收和解压缩方法的流程图。具体实施例方式首先参照图1,示出了一个系统,用于对来自多媒体源12的、包括视频流的经过压缩的多媒体进行发射和接收的系统,总体标记为10。尽管这里所公开的内容关注的是多媒体流的视频部分,但是应该理解的是,本原理也适用于包括音频、幻灯片、2D图形和3D图形等的其它多媒体。如图所示,系统10包括扫描仪14,扫描器14扫描来自于源12的多媒体源图像并将该图像和/或扫描的结果发送到发射处理器16,根据下面讨论的逻辑,该发射处理器16与其他部件一起起到符号识别器和视频压缩器的作用。这里所使用的“符号”意味着图形符号和字母-数字字符两者,因此“符号识别”包括了符号识别和字符识别两种。尽管为了公开内容的简洁,只示出了单个发射处理器16,但是可以使用多个处理器来执行图2中的逻辑。例如,在其中与流分离开来压缩符号自身的实施例中,能够如图所示来提供符号处理器17。如下面所讨论的,将压缩后的视频与由字符/符号识别得到的符号信息一起发送到发射机18以用于其发射。图1中示出的非限制优选实施例示出了使用无线装置的多媒体发射机18,更具体的是使用码分多址(CDMA)原理的多媒体发射机18。可以根据需要将流广播到多个接收机,或者使用点到点或多播无线传输原理来将流发射到多个接收机。应该理解的是,本原理可应用于其它形式的无线通信,例如GSM、TDMA、S-TDMA、宽带CDMA、OFDM等,以及通过电缆系统、互联网等进行的多媒体传输。一个或多个接收机20能够接收所发射的视频和符号信息并将其发送到一个或多个接收处理器22。接收处理器22起到视频解压器的作用。如果需要,假如在传输过程中符号被压缩,那么接收处理器22也能够对该符号进行解压缩,或者由如图所示的单独的符号处理器23来对该符号进行解压缩。然后流合并器24根据下面讨论的图3的逻辑将符号与图像流合并。具有符号的解压缩后的多媒体可以显示在诸如视频显示器、打印机、扬声器等的输出设备25上。现在参照图2来了解压缩和发射逻辑。在块26,由适当的扫描设备14对流中的视频图像进行扫描。可以使用任何适当的扫描器14。优选地,可以以相当高的采样速率来扫描图像,该采样速率足够来降低或消除视频图像中的符号的失真。由扫描器14生成具有符号的图像的数字化表示。如果需要,并非需要扫描流中所有的视频帧。例如,可以扫描每第十个帧直到检测到符号。然后,扫描符号的随后的每个帧。当遇到的帧没有符号时,扫描频率能够回到每第nth帧进行扫描。这样,就增加了扫描速度。进行到块28,利用在发射处理器16(或,如果需要,符号处理器17)上执行的字符识别软件来识别图像中的符号。能够使用任何适当的字符识别算法。发射处理器16(或符号处理器17)生成符号信息,即符号的二进制表示,所述符号的二进制表示不仅表明了被扫描的符号的标识(类型),而且优选地表明了图像中的符号的位置,以及如果需要,还可以表明符号的颜色、字体、尺寸等。因此,这里所使用的“符号信息”和信息/数据“符号的表示”有别于基于逐像素来表示视频图像的非符号部分的颜色或灰影(grayshade)的像素化数据。更确切地,“符号信息”意味着由字符识别引擎输出的二进制码,该字符识别引擎与特定的字符(及其上面提到的特征)相互关联。在块30记录这个符号信息。在扫描之后,在块32对视频图像(最低限度,表示非符号图像数据的像素信息)进行压缩。可以使用任何适当的视频压缩方法或算法。在一个优选实施例中,通过例如处理器16消除符号(例如通过将由符号区域覆盖的像素设置成单个的预定的二进制值)来本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:理查德·D·莱恩阿姆农·西尔贝格
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利