视频信息中自动的自然内容检测制造技术

技术编号:2948520 阅读:126 留言:0更新日期:2012-04-11 18:40
公开了一种区分由排列在线上的一个矩阵中的象素所表示的视频信息中的自然和合成内容区域的方法。为该矩阵的每一线建立象素值的一个亮度直方图(hist(L))。一条线被分类为包含自然内容,如果大多数距离(d)小于或等于一个预定值。然后把包含自然内容的相邻线分组在一起以建立自然内容组。然后以预定次数重复该处理,以便更精确定义具有自然内容的区域。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及用于区分视频信息中的自然和合成内容的区域的一种方法、设备和装置。
技术介绍
CRT监视器的特征一方面是它比电视屏幕有较高的分辨率,另一方面是较低的亮度。这是由于下述事实,最初在计算机监视器上显示地内容全部是合成的,特别是,它曾由文字代表。这一类型内容明显需要高的分别率来使用户满意,但是这使得亮度减小。现今的情形有很大的变化。因特网和多媒体技术,例如DVD和图像存储和传输,引起自然的TV型内容的数量在监视器应用中增加。这一新的情形引起监视器的一系列问题,因为监视器最初不是为这种内容设计的。新概念CRT监视器的基本思想是监视器应该能够适应在特定时刻所显示的图像的内容。一个例子是对自然内容应用视频增强算法以便获得在监视器上显示的自然图像的质量显著改善。然而,如果这些视频增强算法应用于纯文字或图形,总体结果是图像质量的显著损失。从这一观点出发,区分自然和合成内容的能力变得十分重要。已经公知增强解决方案,它可以明显改善视觉性能,如果它应用于在屏幕上自然内容存在的特定区域中的话。由用户执行的基于窗口(它是基于应用的)的手工选择是为识别这些区域的一个简单但是枯燥的方法,它可以适用于整个窗口内容是自然内容的情况。不幸的是,在同一窗口内有复合内容的场合,不能使用同一个方法,而复合内容在万维网页中是典型的,因为,如上所述,视频增强算法对纯文字或图形的应用可以引起在它们感觉到的视觉质量方面显著的损失。因此,需要一种用于在把内容显示在监视器上之前区分自然的和合成的内容的方法、设备和装置。专利技术概述本专利技术的一个目的是通过提供一种方法、设备和装置克服上述缺点,所述方法、设备和装置只使用图像中的未经加工的屏幕数据来区分自然内容和合成内容。本专利技术由所附独立权利要求限定。从属权利要求则限定有利的实施例。根据本专利技术的一个实施例,自然图像内容借助统计分析而与合成图像内容区分,所述统计分析的目的是从图像中抽取某些特征,然后对这些特征做智能解释。这一方法的一个优点是通过定位在对所抽取的特征的分析中的而不是图像分析中的所有“智能”而使计算复杂性降到极小。在视频信息的场合,视频信息作为一系列的图像来处理,每一图像独立处理。在该方法的第一步骤中,分析视频信息。作为下一步骤,把视频信息中在分析期间找到包含相似特征的相邻部分组合在一起。所述部分可以是图像的行或列的线,但是也可以是线的一些部分。最后,把具有第一特征的组指定为自然内容,而剩余的组指定为合成内容。如果为矩阵的每一线建立象素值的亮度直方图将是有利的。然后决定对于每一线的每一非零直方图值之间的距离。如果大多数距离小于或等于一个预定值的话,则该线被分类为包含自然内容。然后把包含有自然内容的相邻线组合到一起以建立具有自然内容的线的组。参考下面说明的实施例,本专利技术的这些以及其它方面将十分显然。附图说明参考附图并以举例方式说明本专利技术,附图中图1(a)表示一个一般算法思想的方框图1(b)表示根据本专利技术的算法的方框图2(a)-(c)表示根据本专利技术的实施例的一个合成场合的亮度直方图分析;图3(a)-(c)表示根据本专利技术的实施例的一个中间合成场合的亮度直方图4(a)-(c)表示根据本专利技术的实施例的一个自然场合的亮度直方图分析;图5表示根据本专利技术的实施例的用于存储与目标区域的坐标有关的信息的数据树;图6描述根据本专利技术的实施例的从目标区域提取的一些子区域;图7-10表示一些屏幕实录,用于说明本专利技术的一个说明性例子。具体实施例方式本专利技术可以被视为是分段和识别的混合。信号识别的许多问题在许多文献然后在应用中被提出和解决,但是大多数问题涉及的是单维信号。虽然建议的这些解决方案非常不同,但是如果一个一般的分析能解决所有问题的话,则可以指出一些相似性。事实上,这些建议的解决方案的大多数都提出一个相似的一般结构,其示于图1(a)。首先,提出一个特征抽取框100,它执行所谓的“特征抽取”,后随一个特征分析框102,它执行“特征分析”。显然,这一说明表示很一般的抽象,因为术语“特征”可以意味着许多不同的对象。然而,本专利技术的一个关键的思想是,该算法的“智能”必须在特征分析框102中被提出,该分析不针对原始数据,而针对原始数据一个经过过滤的(浓缩的)版本。原始数据可以受噪声或无用的外部信息或对识别有害的信息污染。反之,特征被视为只包含基本信息的数据(在一般意义上)的一个被过滤的版本。从这些考虑出发,可以提出几个见解。首先,算法的大多数智能集中在特征分析框102。其次,与先前的见解相反,大多数资源消耗部分通常是特征抽取框100,因为一般说,原始数据比抽取后的特征需要例如较大的存储器用来存储数据。最后,特征抽取是最关键的阶段。事实上,发现真正包含为特征分析所需要的信息的被抽取的特征是至关重要的。图1(b)表示为实现本专利技术的一个实施例的系统。该系统包括亮度变换单元120、控制器122、直方图评估器124、由分析器1108和规则应用单元1110组成的分类单元126、和坐标抽取器128。下面说明系统的操作。在图像中的象素矩阵的亮度值L(x,y)得不到但是红、绿和蓝颜色分量的值可得到的场合,亮度变换单元120提供需要的变换,解释如下。因为已经公知,亮度包含关于形状的最大部分的信息,因此,使用这一参数处理是很重要的。在文献中,亮度由下面的公式提供L(x,y)=(0.2989*R(x,y)+0.5870*G(x,y)+0.1140*B(x,y)其中,L、R、G、B在范围内,R、G、B是矩阵中具有坐标x,y的象素的红、绿和蓝颜色分量。避免浮点运算的一个简化版本(当L、R、G和B在范围内时,这在对本实施例的进一步解释中假定)是 亮度值L(x,y)的直方图在直方图评估器124中评估,说明如下。一个关键的思想是单独评估图像的每一行的亮度值L(x,y)的单维直方图。对列则重复同一类型的运算以获得另外一组直方图。本专利技术的这一实施例的一个重要的假定是,要被识别的区域是矩形区域。必须注意,这一方法在所公开的方法中隐含地包含这一个几何假定。事实上,单独分析行和列导致仅在水平和竖直方向上分析图像,但是本专利技术不限于此。从计算的观点看来,亮度值L(x,y)的处理是最消耗资源的。必须逐个象素扫描整个图像。然而,如上所述,目的是分析整个图像以获得一组特征,该组特征不像整个图像的亮度数据那样庞大。分类单元26后面的一个关键思想是将线(行和列)分类为自然图像,如果该相应直方图具有自然图像的特征的话。从经验测试注意到,有关自然图像的直方图具有与有关合成图像的直方图相比不同的特征。这些特征包括在亮度直方图L(x,y)的连续非零元素之间的距离d。分析器1108使用这些距离的距离直方图hist(d)分析这些距离。在这一分析中的关键思想是在线中存在相当数量自然图像的场合,小距离比大距离更为可能。然后在规则应用单元1110中使用一个分类规则根据这些距离将线分类。在表示自然内容和表示合成内容的距离直方图hist(d)之间显著的区分使用下述规则获得CLASSIFICATION RULE(分类规则)IF(如果)arg(max(hist(d))}=1THEN NATURAL(则是自然的)ELSE SYNTHETIC.(否则是合成的)如前所述,已经假设有一个亮度值范围,因此,本文档来自技高网...

【技术保护点】
一种区分视频信息中自然和合成内容的区域的方法,包括步骤:分析视频信息;把在分析期间发现的包含相似特征的视频信息的相邻部分组合到一起;指定具有第一特征的相邻部分的组为自然内容,指定任何剩余组为合成内容。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:M马科尼P卡赖G费尔雷蒂
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利