失焦状况下的对象检测和识别制造技术

技术编号:8612898 阅读:256 留言:0更新日期:2013-04-20 02:24
一种智能对焦技术包括识别数字图像中诸如脸部之类的感兴趣对象。应用被训练以将对焦和未对焦的脸部进行匹配的对焦通用分类器链和/或接受来自于脸部追踪模块的数据。多个对焦特定分类器链得以被应用,包括被训练以对实质上失焦的脸部进行匹配的第一链,以及被训练为对略微失焦的脸部进行匹配的第二链。使用MEMS分量对焦点位置进行快速调节。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及失焦状况下的对象(例如脸部)检测和识别。
技术介绍
数码相机中的脸部检测涉及标识出图像内对应于脸部的子窗口或区域或像素群组。Viola-Jones在US2002/0102024中提出了用于在诸如数码静态相机、相机电话或视频录影机之类的数字图像获取设备内实施脸部检测的最早的可行技术之一。Viola-Jones是基于由一系列顺序特征检测器所构成的分类器链。该分类器链拒绝并不表示脸部的图像模式而接受表示脸部的图像模式。其它方面的脸部识别涉及标识出图像内候选子穿孔中的个体。脸部识别过程中的问题在于,具有相似对焦状况的脸部趋向于在“脸部空间”中被聚集在一起。例如,甚至不同个体的失焦脸部的属性在脸部空间内也趋于具有比良好对焦的脸部更为相似的值/特征。这样,就难以对相同人员的图像进行正确聚类。期望能够检测并识别脸部,以及实际上在图像内失焦的其它对象。还期望拥有一种方法来对脸部或其它对象上的焦点进行归一化(normalize),例如以便在脸部/对象识别和/或其它应用中使用。假设对象与数码相机或相机电话、视频相机或者其它支持相机的设备或图像获取设备处于不同距离,则对焦在数字摄像行业是一个众所周知的问题。诸如扩展场深度之类的解决方案确实解决了该问题,但是仅是部分地确保了接近的对象在相机对焦至无限远(深焦)仍然清晰。期望拥有一种有效的技术来对原本具有失焦对象的数字图像进行处理。
技术实现思路
根据本专利技术的方法和装置在所附权利要求中进行限定。本专利技术的实施例使用用于多对象对焦的分类器链和MEMS而提供了快速的自动对焦。附图说明现在将参考附图通过示例对本专利技术的实施例进行描述,其中图1A-图1B图示了依据本专利技术实施例的方法。图2图示了依据本专利技术备选实施例的方法。图3A-图3E图示了依据某些实施例的另外的技术。具体实施例方式本专利技术的实施例在包括MEMS (或类似)技术的数字图像获取设备中实施,该技术允许对焦点进行快速改变。MEMS技术可以如美国专利7,769,281,7,747,155,7,729,603, 7,729,601,7,702,226,7,697,834,7,697,831,7,697,829,7,693,408,7,663,817,7,663,289,7,660,056,7,646,969,7,640,803,7,583,006,7,565,070,7,560,679,7,555,210,7,545,591,7,515,362,7,495,852,7,477,842,7,477,400,7,403,344,7,359,131,7,359,130,7,345,827,7,266,272,7,113,688 和 / 或 6,934,087 中任一项所阐述。这样的系统能够捕获和/或存储在相对短的时间量中所捕获的图像的有限序列。本专利技术的特定实施例被实施为提供脸部(或其它感兴趣对象)检测(和/或追踪)信息的数字图像获取设备中的嵌入式组件。如介绍中所提到的,特别地通过对脸部分类器进行训练所进行的脸部检测已经得到了本申请专利权人和他人的广泛研究和开发,并且因此并不在这里进一步讨论。在某些实施例中,系统捕获图像序列,该图像序列以最初的一个开始随后为与视场中所检测的感兴趣对象(脸部)的数目相等的多个图像。最初的基准、预览或后期查看图像的捕获可以包括利用图像获取设备的缺省设置所捕获的初始图像,例如对焦在主要要素(例如,背景、某个对象、某个脸部)上的图像。可以执行感兴趣对象的图像序列捕获。对于随后的图像而言,从所检测脸部(或对象)集合的特征确定焦点,并且这将在下文中更为详细地进行描述。在不同对焦位置所捕获的多个图像可以被保存在一起,这为用户或编程设备提供了在后期在它们之间进行选择或融合或者在设备中进一步进行处理以提供单个多对焦(mult1-focused)图像的可能性。W02008108112公开了一种包括获取数字图像的脸部照明归一化方法,该数字图像包括显现为被不均衡照明的脸部。一个或多个不均衡照明分类器程序被应用于脸部数据以确定脸部在数字图像内的呈现和/或脸部的不均衡照明状况。该不均匀照明状况可以被校正以由此生成经校正的脸部图像,其显现为具有更为统一的照明例如以增强脸部识别。W02008107112的方法可以被应用于对焦状况。在对焦状况的情况下,例如可以将分类器用于(I)清晰对焦的对象(脸部),(ii)稍有失焦的对象(脸部),和(iii)严重失焦的对象(脸部)。图1A-图1B图示了示例性的详细工作流程。在已经获取了包括景象中的感兴趣目标的给定景象图像和所标识出的一个或多个子窗口的情况下,该工作流程从步骤802进行。该子窗口例如可以通过运行第一作为一般对象检测器的分量而使用较高级、较简单或松散的分类器在图像内从头开始确定。这些分类器无法与感兴趣对象内较为精细的特征相匹配,并且因此它们对对焦和未对焦对象都提供良好匹配。在一个优选实施例中,这些分类器为Haar分类器。备选地,可能已经从之前所获取的图像对子窗口进行了追踪。在802,利用准确对焦分类器集合(例如,使用3-5个分类器)对包含诸如脸部之类的对象的给定子窗口进行测试。如果在804确定了累积概率高于第一阈值,则在806确定诸如脸部的对象是准确对焦的,并且该过程利用该完整分类器链继续进行。如果确定了累积概率低于第二阈值(其甚至低于第一阈值),则在812确定子窗口不包含脸部,并且该过程经由864返回至802,在那里对下一个感兴趣对象(脸部)进行测试。如果在808确定了累积概率高于第二阈值,但是低于804的第一阈值,则在810认为子窗口仍然可能是脸部,但是并不是准确对焦的脸部。因此,在814应用下一个失焦的具体部分分类器集合。虽然在步骤814利用稍有失焦的分类器集合(例如,使用3-5个分类器)对子窗口进行测试,但是分类器可以以任意顺序加以应用。如果在816确定了累积概率高于第一阈值,则在818确定脸部稍有失焦,并且该处理利用该完整的分类器链继续进行。如果在820认为累积概率处于第一阈值和较低的第二阈值之间,则在822确定该子窗口仍然可能包含脸部,但是是稍有失焦的脸部,并且因此该过程移动至826以便应用下一个失焦的具体部分分类器集合。如果认为累积概率小于第二阈值,则在824确定子窗口不包含脸部,并且该过程通过864回到下一个子窗口和802。在826,利用明显失焦的部分分类器集合(例如,使用3-5个分类器)执行子窗口的测试。如果在828确定了累积概率高于第一阈值,则确定脸部为明显失焦并且在830利用该完整分类器链继续该过程。如果在832累积概率低于第一阈值但是高于较低的第二阈值,则在834确定子窗口仍然可能包含脸部,虽然不是明显失焦的脸部,并且该过程因此移动至838和图1B以在存在的情况下应用下一个失焦的具体部分分类器集合。如果在832认为累积概率高于第二阈值低于828所指示的第一阈值,则在858仍然认为子窗口可能包含脸部,虽然不是清晰对焦的脸部也不是稍有失焦的脸部也不是明显失焦的脸部,并且因此现在在862应用具体部分分类器集合配对。这是因为此时窗口还没有在其第一阈值通过任何对焦状况的具体分类器,而是已经被拒绝作为脸部。因此,可能的情形是子窗口包含有对焦状况类型的组合所表示的脸本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.11.11 US 12/944,7011.一种数字图像处理方法,包括利用包括数字图像获取设备获取包括多个特征的景象;标识出对应于所述景象内的第一特征的第一像素群组;使用MEMS组件将光学器件实时调节至第一对焦位置以将所述设备对焦在所述第一特征上;在所述第一对焦位置捕获第一数字图像;标识出对应于近似相同景象内的第二特征的第二像素群组;使用所述MEMS组件将所述光学器件实时调节至第二对焦位置以将所述设备对焦在所述第二特征上;在所述第二对焦位置处捕获第二数字图像;注册包括所述第一特征和所述第二特征的所述第一数字图像和所述第二数字图像;以及将所述第一数字图像和所述第二数字图像一起进行存储、传送、组合、捕获或显示,或者其组合。2.根据权利要求1的方法,进一步包括确定所述第一特征在所述第二数字图像中显现为模糊、或者所述第二特征在所述第一图像中显现为模糊、或者这二者,并且其中将所述第一数字图像和所述第二数字图像一起进行存储、传送、或显示,或者其组合包括生成复合图像,所述复合图像包括来自所述第一数字图像的所述第一特征以及来自所述第二数字图像的所述第二特征,从而得所述第一特征和所述第二特征这二者在所述复合图像中都显现为清晰。3.根据权利要求2的方法,其中所述生成复合图像包括将所述第一图像和所述第二图像进行混合。4.根据权利要求2的方法,其中所述生成复合图像包括将所述第一图像和所述第二图像进行变形。5.根据权利要求1的方法,还包括其中将所述第一数字图像和所述第二数字图像一起进行所述存储、传送、或显示,或者其组合包括提供切换特征以一起调用所述第一数字图像和所述第二数字图像并且在它们之间进行切换。6.根据权利要求5的方法,进一步包括接收对所述第一数字图像和所述第二数字图像中的一个的选择用于进一步进行存储、传送、显示或进一步处理,或者其组合。7.根据权利要求5的方法,其中所述切换特征允许显示器得以显现,以证明在相同图像中在所述第一对焦位置和所述第二对焦位置之间进行切换。8.根据权利要求1的方法,其中所述注册包括通过应用数字或机械图像稳定化或者这二者来对所述第一数字图像和所述第二数字图像进行对准。9.根据权利要求1的方法,其中标识出所述第一像素群组或所述第二像素群组分别包括对所获取的景象应用脸部检测,并且标识出对应于第一脸部或第二脸部的所述第一特征或所述第二特征。10.根据权利要求9的方法,进一步包括对所述第一像素群组或所述第二像素群组或这二者应用脸部追踪,以用于在后续图像中继续分别标识出对应于所述第一脸部或第二脸部的所述第一像素群组或所述第二像素群组。11.一种在景象中的所检测脸部区域上进行智能对焦的方法,包括a)使用包括透镜、图像传感器、存储器和处理器的支持相机的设备来获取所述景象的数字图像;b)在所述数字图像内标识出包含脸部的一个或多个像素群组;c)对所标识出的像素群组应用多个特定于对焦的分类器链,所述分类器链包括被训练为与实质性失焦的脸部相匹配的第一分类器链,和被训练为与略有失焦的脸部相匹配的第二分类器链;以及d)响应于所述像素群组明显匹配于所述第一特定于对焦的分类器链或第二特定于对焦的分类器链中的一个或这二者,确定所述脸部没有被清晰对焦;并且e)响应于所述脸部没有被清晰对焦,基于在一个或多个在前对焦位置处所确定的对焦程度而使用MEMS组件调节对焦位置一次或多次,以在所述脸部上进行对焦。12.根据权利要求11的方法,其中所述标识步骤b)包括应用被训练为与对焦和未对焦脸部相匹配的对焦通用分类器链;接受来自脸部追踪模块的数据,或者这二者。13.根据权利要求11的方法,其中所述调节步骤e)包括响应于所述脸部与所述第一特定于对焦的分类器链最佳匹配,粗略调节至第二对焦位置并且重复应用多个对焦通用分类器链。14.根据权利要求13的方法,其中所述调节步骤e)进一步包括响应于确定所述脸部在所述第二对焦位置实质上未对焦,与到所述第二对焦位置相反地将焦点粗略调节至第三对焦位置和/或相对于调节至所述第二对焦位置以减少或增加的量将焦点粗略调节至第三对焦位置。15.根据权利要求13的方法,其中所述多个特定于对焦的分类器链进一步包括第三特定于对焦的分类器链,所述第三特定于对焦的分类器链被训练为与清晰对焦的脸部相匹配,并且其中所述调节步骤e)包括响应于所述脸部与所述第二特定于对焦的分类器链最佳匹配,精细调节至第二对焦位置,并且重复应用至少三个特定于对焦的分类器链一次或多次,直至利用所述第三特定于对焦的分类器链实现了最佳匹配。16.根据权利要求13的方法,其中所述调节步骤e)包括响应于所述脸部与所述第二特定于对焦的分类器链最佳匹配,精细调节至第二对焦位置,并且重复应用所述第二特定于对焦的分类器链,直至在脸部之前和之后的两个略微未对焦位置之间达到对焦位...

【专利技术属性】
技术研发人员:A·卡帕塔S·佩特雷斯酷P·比焦伊P·科科伦
申请(专利权)人:数字光学欧洲有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1