当前位置: 首页 > 专利查询>微软公司专利>正文

采用边缘和低分辨率信号的高效图像表示制造技术

技术编号:4644155 阅读:230 留言:0更新日期:2012-04-11 18:40
一种用于编码图像的示例性方法包括接收图像数据、检测图像数据中的边缘,选择检测到的边缘中的至少一些,将所选边缘编码为所选边缘信息;对图像数据进行降采样;将降采样后的图像编码为降采样后的图像信息以及复用所选边缘信息和降采样后的图像信息。在这种方法中,所选边缘信息和降采样后的图像信息可以被存储为经编码的图像文件。还公开了各种其它示例性方法、设备、系统。

【技术实现步骤摘要】
【国外来华专利技术】釆用边缘和低分辨率信号的髙效图像表示背景媒体内容(例如,图像和视频)通常以压縮形式存在,以减少存储空间并 帮助传输。例如,媒体服务器通常访问压縮后的媒体并将压縮后的媒体流化至 能够解压縮媒体以用于演示的客户机。压縮被广泛用于各种应用中的传输、存 储和回放。经压縮的媒体通常由以下过程生成。首先,从原始的媒体内容的时间和/ 或空间邻居预测原始的媒体内容。其次,经预测的残差被变换至频域。最后, 系数被量化并被熵编码以生成经压縮的表示。 一般而言,自然图像和视频包含 经预测后仍然存在的丰富的边缘和轮廓。这些边缘构成媒体的高频部分,高频 部分较难编码,因为信号能量在变换到频域后变得有些分散。通常,边缘和轮 廓包含重要的结构性媒体内容,然而,基于变换的表示在保留和利用边缘和轮 廓上存在问题。例如,考虑"蚊子噪声",该"蚊子噪声"是一种出现在MPEG以及采用 依赖离散余弦变换(DCT)的有损技术被压縮的其它视频帧中的对象的清晰边 缘周围的边缘忙碌失真。更具体地,蚊子噪声随解码引擎通过逆向变换模型来 逼近被丢弃的数据而在解压縮时产生。在视频中,蚊子噪声随在边缘的帧对帧 随机混叠而出现(例如,类似蚊子在人的头周围飞,边缘存在于人的头和固体 背景之间)。 一般而言,随着TV和计算机屏幕变得更大,蚊子噪声以及其它 伪像变得更显著。对于仅依赖DCT (—种类似于离散傅立叶变换但只采用实数的傅立叶相关 的变换)的图像压縮技术,边缘和轮廓是完全不可见的。另外一种类型的变换, 即小波变换,是一种时频变换,然而,基于小波的压縮技术仅使用上下文模型 中的结构信息以用于算术编码。因此,DCT和小波技术欠缺以保存边缘和轮廓 信息的方式来表示媒体的能力另外,在基于DCT和基于小波的压縮技术两者中, 访问压縮流或压縮文件中的结构信息是不容易的。此处呈现允许保存边缘和轮廓信息以及允许对这种信息进行访问的技术。概述一种用于编码图像的示例性方法包括接收图像数据、检测图像数据中 的边缘,选择检测到的边缘中的至少一些,将所选边缘编码为所选边缘信 息;对图像数据进行降采样;将降采样后的图像编码为降采样后的图像信 息以及复用所选边缘信息和降采样后的图像信息。在这种方法中,所选边 缘信息和降采样后的图像信息可以被存储为经编码的图像文件。还公开了 各种其它示例性方法、设备、系统。附图简述参考附图描述了非限制性的和非穷尽的实施例,其中除非另外指定,否则 在各个视图中相同的附图标记指示相同的部分。附图说明图1是采用DCT算法的常规有损压縮/解压縮过程的图示,在该过程中, 边缘噪声可出现在从压縮图像中重构的图像;图2是编码和解码图像的示例性方法的图示,该方法结合图像编码和解码釆用边缘编码和解码;图3是用于边缘检测和边缘选择的示例性技术的图示,其中边缘选择根据 率-失真准则而发生;图4是边缘区域、边缘区域的简档(profile)以及边缘区域的简档的二 次导数的图示;图5是沿边缘应用的6抽头滤波器以及跨边缘应用的6抽头滤波器的图示;图6是用于采用链编码方向来编码边缘的边缘编码的示例性技术的图示;图7是用于两个不同场景的可能的边缘链码方向的图示;图8是为能够将码边缘信息串成链的示例性模型提供信息的一对表;图9是用于起始点映射的示例性方法的图示;图10是可用于实现此处所讨论的各种示例性方法的部分或全部的示例性6计算设备的各个组件的图示。详细描述概览一种示例性技术采用基于变换和基于像素的方法保存边缘和轮廓信息。该 技术縮小用于在频域表示的低频区域并在像素域保持所选的高频区域。因此, 对于一给定图像,图像的各低频部分可由低分辨率信号来描述,该低分辨率信 号能够采用常规的基于变换的方法来被有效处理,而图像的各高频部分可由边 缘来描述,该边缘以高分辨率被提取以便直接在像素域处理。当媒体内容被重 构时,可采用高频信号可将縮小的图像从低分辨率插值至例如其原始的分辨 率。由于边缘信息是媒体表示中的独立分量,它可以被获得以用于各种目的(例 如,索引、搜索、分类、机器视觉、科学分析等)。多种技术还允许访问压縮流中的这种结构信息。例如,搜索应用程序可访 问该信息以进行更好的媒体搜索。各图包括用于进行一个或多个动作的代表典型的软件模块的框。例如,框 可以是当执行时进行一个或多个动作的处理器可执行指令。在某些实例中,这种框可以被实现为硬件或硬件和软件。对于硬件,MPEG-4编码器和/或解码器 芯片是通常用于电视机顶盒、DVD播放器、DVD录制机、数字媒体适配器、便 携式媒体播放器等硬件的示例。静止图像各种常规的静止图像压縮技术由联合图像专家组(JPEG)定义。作为许 多基于DCT的处理的典型,基线JPEG有损处理涉及由以下进行的编码(i) 将输入图像的各分量分割成8X8个块;(ii)对每个块进行二维DCT; (iii) 均匀量化各DCT系数;(iv)从先前块中对应的项中减去量化后的DC系数; 以及(v)采用可变长度码(VLC)对量化后的系数进行熵编码。解码是通过逆 序地对编码器的各运算进行逆变化来进行的。例如,解码涉及(i)熵解码; (ii)进行1-D DC预测;(iii)进行逆量化;(iv)对8X8块进行DCT逆 变换;以及(v)重构基于8X8块的图像。尽管该处理不限于8X8块,优选7n为整数的2nX2n的方块。 视频各种常规视频压縮技术由运动图像专家组(MPEG)定义,MPEG为陆地 数字、电缆和卫星电视、DVD、数码录像机(DVR)等提供了一种相对广泛 的标准。MPEG类似于JPEG对各帧采用有损DCT压縮。MPEG还采用通过仅对 各周期性帧之间的差异进行编码来进一步压縮数据的帧间编码。采用帧间编 码,视频序列可由关键帧来表示,该关键帧包含完整内容以及增量帧,关键帧 采用帧间的递增差异来编码。例如,增量帧通常包括有过改变的图像块以及运 动向量(例如,双向等)的信息或从上一帧起移动过的图像块的信息。在视频 内容是比较静态的情况下,增量帧易于被压縮最多。边缘噪声如在背景一节中所解释的,有损DCT压縮并没有充分处理边缘和轮廓。特 别地,随压縮率增加,高频内容噪声增加。被称为"边缘忙碌"的一种失真发 现失真集中在对象的边缘。边缘忙碌还可进一步由媒体内容的时间和空间特征 来表征。例如,当由于量化器的波动使得重构的边缘从一个扫描线到另一个扫 面线在位置上略有变动时,边缘忙碌发生。如已提到的,边缘忙碌的一种更特 定的类型是蚊子噪声,该蚊子噪声是一种出现在MPEG以及采用DCT进行压縮 的其它视频帧中的对象的清晰边缘周围的失真。图1显示一图示以示出由有损DCT压縮/解压縮过程100产生的边缘噪声。 该过程以将采用有损DCT压縮108被压縮的原始图像104为始。该压縮过程108 包括变换算法120、量化变换系数的算法122以及编码量化后的系数的算法124 (例如,熵编码器)。在该示例中,压縮过程108采用量化表130和码表132 以供支持。该压縮图像可以作为比特流112被传输至解压縮在其中发生的目的 地。对于比特流112,信息可以是一种数据分组形式。各种媒体系统(例如, ¥1仰(^3 媒体播放器)可接收分组格式的媒体。另外,可以可选地包括报头和 /或其它信息,其中该信息与该分组相关,例如,分组本文档来自技高网...

【技术保护点】
一种用于编码图像的方法,该方法至少部分地由计算设备执行,该方法包括: 接收图像数据; 检测该图像数据中的边缘,选择检测到的边缘中的至少一些,并将所选边缘编码为所选边缘信息; 降采样图像数据并将降采样后的图像编码为降采样后的 图像信息;以及 复用所选边缘信息和降采样后的图像信息。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:T孙JZ许F吴
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1