脸部检测及跟踪制造技术

技术编号:2931010 阅读:198 留言:0更新日期:2012-04-11 18:40
一种脸部检测设备,用于在视频序列中的图像之间跟踪所检测的脸部,所述设备包括:    第一脸部检测器,用于检测所述图像中脸部的出现;    第二脸部检测器,用于检测所述图像中脸部的出现;    所述第一脸部检测器具有比所述第二脸部检测器更高的检测门限,使得所述第二脸部检测器更可能检测到所述第一脸部检测器在其中没有检测到脸部的区域中的脸部;以及    脸部位置预测器,用于根据按所述视频序列的测试顺序的一个或多个先前图像中所检测的脸部位置来预测按所述视频序列的测试顺序的下一个图像中的脸部位置;    其中:    如果所述第一脸部检测器在所述预测脸部位置的预定门限图像距离内检测到脸部,则所述脸部位置预测器采用所述检测位置来产生下一个位置预测;    如果所述第一脸部检测器未能在所述预测脸部位置的预定门限图像距离内检测到脸部,则所述脸部位置预测器采用所述第二脸部检测器所检测的脸部位置来产生下一个位置预测。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及脸部检测。在文献中提出了许多人脸检测算法,包括所谓的特征脸、脸部模板匹配、可变形模板匹配或神经网络分类的使用。它们之中没有一个是完善的,每个一般都具有相关的优缺点,没有一个提供了关于图像包含脸部的绝对可靠指示;相反,它们都基于概率评估、基于对图像以及对图像是否至少具有包含脸部的一定可能性的数学分析。根据它们的应用,算法一般将门限似然值设置得相当高,以便试图避免对脸部的错误检测。包括捕捉图像的序列的视频资料中的脸部检测比检测静止图像中的脸部稍微更复杂一些。特别是,希望在序列中的一个图像中检测的脸部可通过某种方式链接到序列的另一个图像中的检测脸部。它们(可能)是同一张脸或者它们(可能)是碰巧处于相同图像序列中的两张不同的脸?以这种方式尝试“跟踪”序列中的脸部的一种方式是检查相邻图像中的两张脸是否具有相同或极相似的图像位置。但是,这种方法因脸部检测方案的概率性质而会遇到一些问题。一方面,如果似然门限(对于要进行的脸部检测)设置得高,则在序列中可能存在一些图像,其中脸部出现,但没有被算法检测到,例如因为该脸部的拥有人将他的头部转向侧面,或者他的脸部分被遮蔽,或者他挠鼻子,或者许多可能的原因之一。另一方面,如果门限似然值设置得低,则错误检测的比例将会增加,并且可能让不是脸部的对象在整个图像序列中被成功跟踪。因此,需要一种更可靠的技术用于连续图像的视频序列中的脸部检测。本专利技术提供一种脸部检测设备,用于在视频序列中的图像之间跟踪所检测的脸部,该设备包括第一脸部检测器,用于检测图像中脸部的出现;第二脸部检测器,用于检测图像中脸部的出现;第一脸部检测器具有比第二脸部检测器更高的检测门限,使得第二脸部检测器更可能检测到第一脸部检测器在其中没有检测到脸部的区域中的脸部;以及脸部位置预测器,用于根据按视频序列的测试顺序的一个或多个先前图像中的所检测脸部位置来预测按视频序列的测试顺序的下一个图像中的脸部位置;其中如果第一脸部检测器在预测脸部位置的预定门限图像距离中检测到脸部,则脸部位置预测器采用所检测位置来产生下一个位置预测;如果第一脸部检测器未能在预测脸部位置的预定门限图像距离内检测到脸部,则脸部位置预测器采用第二脸部检测器所检测的脸部位置来产生下一个位置预测。本专利技术通过添加具有较低级检测的另一个脸部检测器,使得第二脸部检测器更可能检测到第一脸部检测器在其中没有检测到脸部的区域中的脸部的违反直觉的步骤,来解决以上问题。这样,第一脸部检测器的检测门限不需要过度放宽,但第二脸部检测器可用于覆盖第一脸部检测器“遗漏”的任何图像。可单独进行关于是否接受有效利用第二脸部检测器的输出的脸部跟踪结果的判定。大家理解,测试顺序可以是向前或向后的时间顺序。甚至两种顺序都可采用。本专利技术的其它各个相应方面及特征在所附权利要求书中定义。现在仅通过举例、参照附图来描述本专利技术的实施例,附图中,同样的部件由同样的标号来定义,图中附图说明图1是用作脸部检测系统和/或非线性编辑系统的通用计算机系统的示意图;图2是采用脸部检测的摄像录像机(便携式摄像录像机)的示意图;图3是示意图,说明训练过程;图4是示意图,说明检测过程;图5示意说明特征图;图6示意说明产生特征块的抽样过程;图7和图8示意说明特征块集合;图9示意说明构建表示块位置的直方图的过程;图10示意说明直方图格编号的产生;图11示意说明脸部概率的计算;图12a至12f是采用以上方法产生的直方图的示意实例;图13a至13g示意说明所谓的多标度脸部检测;图14示意说明脸部跟踪算法;图15a和15b示意说明用于肤色检测的搜索区的导出;图16示意说明应用于肤色检测的面具;图17a至17c示意说明图16的面具的使用;图18是示意距离图;图19a至19c示意说明当应用于视频画面时的脸部跟踪的使用;图20示意说明非线性编辑系统的显示屏幕;图21a和21b示意说明剪辑图标;图22a至22c示意说明梯度预处理技术;图23示意说明电视会议系统;图24和图25更详细地示意说明电视会议系统;图26是流程图,示意说明图23至25的系统的一种操作模式;图27a和27b是与图26的流程图有关的示例图像;图28是流程图,示意说明图23至25的系统的操作的另一种模式;图29和30是与图28的流程图有关的示例图像;图31是流程图,示意说明图23至25的系统的操作的另一种模式;图32是与图31的流程图有关的示例图像;以及图33和图34是流程图,示意说明图23至25的系统的操作的其它模式;图1是用作脸部检测系统和/或非线性编辑系统的通用计算机系统的示意图。计算机系统包括处理单元10,其中(除其它传统组件之外)还具有中央处理器(CPU)20、诸如随机存取存储器(RAM)的存储器30以及诸如盘驱动器的非易失性存储器40。计算机系统可连接到诸如局域网或因特网(或两者)的网络50。还提供了键盘60、鼠标或其它用户输入装置70及显示屏幕80。技术人员会知道,通用计算机系统可包括在此不需要描述的其它许多传统部件。图2是采用脸部检测的摄像录像机(便携式摄像录像机)的示意图。便携式摄像录像机100包括镜头110,它将图像聚焦到电荷耦合器件(CCD)图像捕捉装置120上。所得电子形式的图像由图像处理逻辑130处理,以便记录在诸如盒式磁带的记录媒体140上。装置120捕捉的图像还显示在可通过目镜160查看的用户显示器150上。为了捕捉与图像关联的声音,使用了一个或多个麦克风。它们在通过软性电缆连接到便携式摄像录像机的意义上可以是外部麦克风,或者可安装在便携式摄像录像机主体本身上。来自麦克风的模拟音频信号由音频处理装置170处理,从而产生用于记录在存储媒体140中的适当音频信号。要注意,视频和音频信号可通过数字形式或模拟形式或者甚至两种形式记录在存储媒体140中。因此,图像处理装置130和音频处理装置170可包括模数转换级。便携式摄像录像机用户能够通过用户控件180来控制镜头110的性能的各方面,其中用户控件180促使镜头控制装置190向镜头110发送电控制信号200。诸如聚焦和变焦之类的属性通常以这种方式控制,但镜头光圈或其它属性也可由用户控制。示意说明其它两种用户控件。按钮210被提供用来开始及停止记录到记录媒体140中。例如,控件210的一次推按可开始记录,以及另一次推按可停止记录,或者控件可能需要保持在推按状态以便让记录开始进行,或者一次推按可开始记录一定的时段、例如五秒。在这些装置的任一个中,从便携式摄像录像机录制操作中设置每个“拍摄”的开始和结束发生之处(连续记录时段)在技术上极为简单。图2示意所示的另一个用户控件是“出色镜头标记器”(GSM)220,它可由用户操作,使“元数据”(关联数据)与视频和音频资料相关联地存储到记录媒体140中,表明这个特定镜头被操作者主观认为在某个方面“出色”(例如,演员表演极优秀,新闻记者正确地讲出每个单词,等等)。元数据可记录在记录媒体140的某个备用容量(例如“用户数据”)中,取决于所使用的特定格式和标准。或者,元数据可存储在单独的存储媒体、如可拆卸MemoryStickRTM存储器(未示出)中,或者元数据可存储在外部数据库(未示出)中,例如通过无线链路(未示出)传递到这种数据库。元数本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:R·M·S·波尔特尔R·拉姆巴鲁思S·海恩斯J·利文
申请(专利权)人:索尼英国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1