采用神经网络定位对象图像中的感兴趣点的系统和方法技术方案

技术编号:2926772 阅读:255 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种用于定位对象图像中的至少两个感兴趣点的系统。根据本发明专利技术,一种这样的系统使用人工神经网络并具有分层的体系结构,包括:接收所述对象图像的输入层(E);至少一个中间层(N↓[4]),被称为第一中间层,包括多个神经元(N↓[41]),这些神经元可被用于生成至少两个显著性图(R↓[5m]),每个显著性图与所述对象图像中一个不同的预定义的感兴趣点相关联;和至少一个包含上述显著性图(R↓[5m])的输出层(R↓[5]),所述图包括多个神经元,每个神经元与第一中间层的所有神经元相连。根据本发明专利技术,借助于在每个显著性图上的唯一全局最大值的位置(17↓[1],17↓[2],17↓[3],17↓[4]),在对象图像中定位所述感兴趣点。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及静止或运动图像的数字处理领域。更具体地,本专利技术 涉及在用数字图像表示的对象中定位一个或多个感兴趣点的技术。本专利技术特别适用于但不一定专用于以下领域检测在数字或数字 化图像中的面部的物理特征,例如瞳孔、眼角、鼻尖、嘴部、眉毛等。 实际上,面部图像的感兴趣点的自动检测是面部分析的主要方面。
技术介绍
在本领域中有几种已知的技术,它们大多包括利用专用的、专门 化的过滤器独立地搜寻和检测每个特定的面部特征。所使用的大多数检测器依赖于对面部的色度的分析面部的像素 根据它们的颜色被标记为属于皮肤或者面部元素。其它检测器使用对比度变化。至此,依赖于对光梯度的分析,完 成了轮廓检测。然后尝试根据检测出的不同轮廓来识别面部元素。其它方法利用每个元素的统计模型实施相关性搜索。这些模型是 使用所要搜寻的每个元素的图像(或者本征特征)由主要成份分析 (PCA)构建的。某些现有技术实施第二阶段,其中对在每个元素的独立检测的第 一阶段中确定的所有候选位置应用几何面部模型。在初始阶段检测到 的元素构成了候选位置的合成体,可变形的几何模型被用于选择最佳 合成体。近来一种方法可被用来超越传统的两步骤方案(包括对面部元素 的独立搜索,接着是应用几何规则)。该方法依赖于活动表情模型 (AAM )的4吏用,在D. Cristinacce和T. Cootes的文章"A comparisonof shape constrained facial feature detectors" ( 2004年韩国首尔的第 六届面部和姿势自动识别国际会议的论文集,pp 375-380, 2004 )中有 专门的描述。它由以下步骤组成通过调整包含形状和紋理的线性模 型的参数,尝试使一个活动面部模型对应于图像中的面部,借此来预 测面部元素的位置。该面部模型是从利用对向量的主要成份分析 (PCA)来标注感兴趣点的多个面部中学习得到的,所述向量编码感 兴趣点的位置和相关面部的光紋理。 现有技术的缺点这些现有技术的主要缺点是在含有影响面部图像,特别是对象图 像的噪声的面部中鲁棒性较低。事实上,专门设计用来检测面部元素的检测器不能抵抗图像照明 的极端条件,例如过度照明、照明不足、侧光、从底部照明。它们对 于图像质量的变化也几乎没有什么鲁棒性,特别是在从(例如利用网 络摄像头采集的)视频流获得的低分辨率图像或者前面已受到压缩的 低分辨率图像的情况下。依赖于色度分析(其应用肤色过滤器)的方法对于照明条件也很 敏感。此外,它们不能应用于灰度级图像。这些依赖于对不同感兴趣点的独立检测的现有技术的另 一个缺 点是当这些感兴趣点被隐藏时,这些技术完全没有办法,例如在戴 墨镜时眼睛就被隐藏起来,当有胡子或者被手遮挡时嘴部就被隐藏起 来,更常见的情形是图像出现局部严重退化时。检测几个元素甚至只是一个元素的失败通常不会由于后面使用 几何面部模型而被修正。该模型只是当不得不在几个原本应在前一阶 段检测出的候选位置中做出选择时才被使用。这些不同的缺点在依赖于活动面部的方法中得到部分补偿,这些 方法通过形状和紋理信息的联合使用实现对元素的大致搜索。然而, 这些方法有另一项缺点,即它们依赖于緩慢的、不稳定的最优化过程, 该过程有赖于必须在搜索期间反复确定的成百上千的参数,这是一个 特别漫长又痛苦的过程。此外,由于所使用的统计模型是线性的,由PCA创建的,所以 它们对于图像的整体变化,特别是照明变化表现出低的鲁棒性。它们 对于面部的部分隐藏具有低的鲁棒性
技术实现思路
本专利技术的目标本专利技术的目的就是为了克服现有技术的这些缺点。更具体地,本专利技术的目标是提供一种用于在表示一个对象的图像中定位几个感兴趣点的技术,它不需要专用于必须能被定位的每个感兴趣点以及专用于每一类对象的过滤器的漫长又痛苦的开发过程。本专利技术的另一个目标是提出这样一种定位技术,它对于可能影响图像的所有噪声,例如照明条件、色度变化、部分隐藏等都有很强的鲁棒性。本专利技术的另 一个目标是提供这样一种技术,它考虑了部分影响图 像的隐藏问题,并允许对隐藏点的位置进行推断。本专利技术还有一个目标是提供这样一种技术,它应用简单,实施成本低。本专利技术还有一个目标是提供这样一种技术,它特别适于面部图像 中的面部元素的检测。这些目标以及在下面将会表现出的其它目标是通过一种用于定 位对象图像中的至少两个感兴趣点的系统实现的,该系统采用人工神 经网络并呈现分层的体系结构,该系统包括-接收所述对象图像的输入层;-至少一个中间层,被称为第一中间层,包括多个神经元,这些 神经元使得能够生成至少两个显著性图,每个显著性图与所述对象图 像的一个预定义的不同的感兴趣点相关联;-至少一个包括所述显著性图的输出层,所述显著性图包括多个 神经元,每个神经元与所述第一中间层的所有神经元相连,借助于在每个所述显著性图上的唯一总体最大值的位置,在对象 图像中定位所述感兴趣点。可见,由于本专利技术提出了神经分层体系结构的使用,使得可在输 出上生成几个显著性图,使得通过对最大值的简单搜索可以直接检测 待定位的感兴趣点,因此本专利技术是基于完成新颖和创新的方法来检测 在表示对象的图像中的几个感兴趣点。本专利技术因此提出了 一种借助于神经网络在整个对象图像中全面 搜索不同的感兴趣点的技术,使得有可能特别考虑这些点的相对位 置,还可以克服与这些点的全部或部分隐藏有关的问题。输出层包括至少两个显著性图,每个显著性图与预定义的一个不 同的感兴趣点有关。因而可以通过使每个显著性图专用于一个特定的感兴趣点该点然后通过对每个图上的唯一最大值的搜索而被定位, 借此对几个感兴趣点同时进行搜索。这与在一个总显著性图上与所有 感兴趣点相关联地对几个局部最大值同时进行搜索相比,要容易一 些。此外,不再需要设计和开发专用于不同感兴趣点的检测的过滤 器。在完成初步的学习阶段后利用神经网络自动找到这些过滤器。此外,这种神经体系结构证明在对象图像照明等可能的问题方面 要比现有技术更具鲁棒性。必须指出,这里的术语"预定义的感兴趣点,,被理解为代表对象的 一个显著的元素,例如在面部图像的情况下,它会是眼睛、鼻子、嘴 部等。本专利技术因此不是对图像中的任何轮廓都进行搜索,而是对预定义 的标识的元素进行搜索。根据一个有利的特点,所述对象图像是面部图像。于是,所搜寻 的感兴趣点是永久实体特征,例如眼睛、鼻子、眉毛等。有利地,这种定位系统还包括至少一个包括多个神经元的第二中 间巻积层。这样一层可以专用于检测对象图像中的低级元素,例如对 比度线(contrast line )。优选地,这种定位系统还包括至少一个包括多个神经元的第三亚抽样中间层。因此减小了在上面完成工作的图像的尺度。在本专利技术的优选实施方式中,这样的定位系统在所述输入层和所述第一中间层之间包括-包括多个神经元的第二中间巻积层,该层使得能够在所述对象 图像中检测至少一个基本线型形状,所述第二中间层送出巻积对象图 像;-包括多个神经元的第三中间亚抽样层,该层使得能够减小所述 巻积对象图像的大小,所述第三中间层送出减小的巻积对象图像;-包括多个神经元的第四中间巻积层,该层使得能够在所述减小 的巻积对象图像中检测至少一个角型复杂形状。本专利技术还涉及如上所述的用于定位对象图像中的至少两个本文档来自技高网
...

【技术保护点】
一种用于定位对象图像中的至少两个感兴趣点的系统,其特征在于该系统应用人工神经网络并呈现分层的体系结构,该系统包括:    接收所述对象图像的输入层(E);    至少一个中间层(N↓[4]),被称为第一中间层,包括多个神经元(N↓[41]),这些神经元使得能够生成至少两个显著性图(R↓[5m]),每个显著性图与所述对象图像的一个预定义的不同的感兴趣点相关联;    至少一个包括所述显著性图(R↓[5m])的输出层(R↓[5]),    所述显著性图包括多个神经元,每个神经元与所述第一中间层的所有神经元相连,    借助于在每个所述显著性图上的唯一总体最大值的位置(17↓[1],17↓[2],17↓[3],17↓[4]),在对象图像中定位所述感兴趣点。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:克里斯托弗加西亚斯特凡多弗内尔
申请(专利权)人:法国电信公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1