生成用于人脸检测的训练集的方法技术

技术编号:2941667 阅读:336 留言:0更新日期:2012-04-11 18:40
提供一种生成用于人脸检测的训练集的方法,包括:通过将包括在输入的基础训练集中的所有样本图像转换为灰度级并且缩放到标准大小来对所述图像进行规一化;将规一化的基础训练集聚类到预定数目的具有近似大小的子训练集,包括在每个所述子训练集的样本彼此相似;并且对从所述聚类的标准获得的每个子训练集执行以下步骤以形成压缩的训练集:通过从所述子训练集去除预定比例的外围样本来对所述子训练集净化,通过选择代表样本分布的样本并将选择的样本添加到缩减的子训练集来缩减子训练集的大小。

【技术实现步骤摘要】

本专利技术涉及人脸检测,更具体地讲,涉及一种通过净化和缩减来生成压缩训练集的用于人脸检测的训练集的方法,所述压缩训练集具有相似的样本分布。
技术介绍
人脸检测是脸部追踪(tracking)、建模和识别所必需的。多视角人脸检测对于数码相机自动聚焦、自动曝光和自动白平衡非常重要。此技术也可以用于对象检测、机器学习、模式识别等。 多视角(multi-view)人脸检测技术基于机器学习的策略。为了达到高检测率,需要大的训练集来训练准确的人脸检测器。但是,对于这种训练集的训练过程对一个CPU来说可花费几个月的时间。 训练基于boosting算法的多视图人脸检测器是非常耗时的工作。例如,对于单个普通的PC来说,可能需要几个月或者数年的时间。没有功能强大的计算机,这样的计算将会是灾难性的。当前,几乎所有的研究者采用并行和快速的计算系统。 因此,需要一种生成压缩和有效的训练集以减少训练时间而不降低系统性能的方法。
技术实现思路
本专利技术的示例性实施例克服上述的不足和上面没有描述的不足。此外,不要求本专利技术克服上述的不足,而且本专利技术的示例性实施例可以不克服上述的任何不足。 根据本专利技术的一方面,提供一种,包括通过将包括在输入的基础训练集中的所有样本图像转换为灰度级并且缩放到标准大小来对所述图像进行规一化;将规一化的基础训练集聚类到预定数目的具有近似大小的子训练集,包括在每个所述子训练集的样本彼此相似;并且对从所述聚类的标准获得的每个子训练集执行以下步骤以形成压缩的训练集通过从所述子训练集去除预定比例的外围样本来对所述子训练集净化,通过选择代表样本分布的样本并将选择的样本添加到缩减的子训练集来缩减子训练集的大小。 优选为,聚类规一化的基础训练集的步骤包括a)将当前子训练集的数目设置为1,并且将当前子训练集设置为所述基础训练集;b)从当前子训练集选择训练集大小最大的子训练集;c)使用聚类算法将选择的子训练集划分为2个子训练集;d)重复步骤b)和步骤c),直到当前子训练集的数目达到所述预定数目。 优选为,所述对子训练集净化的步骤包括使用概率模型为子训练集建模;和从所述子训练集去除具有低概率的预定比例的样本。 所述概率模型可以是高斯混合模型、高斯模型和相似性模型之一。 优选为,所述缩减子训练集的步骤包括e)在净化的子训练集内,挑选距离高斯中心最近的样本作为种子样本;f)从净化的子训练集去除种子样本,并且将所述种子样本添加到缩减的子训练集;g)将缩减的子训练集的大小设置为种子样本的数目;h)在净化的子训练集中选择距离当前的缩减子训练集最远的样本;i)从净化的子训练集去除选择的样本,并且将其添加到缩减的子训练集;和j)重复步骤h)和i),直到缩减的子训练集的大小达到预定数目。 根据本专利技术的另一方面,提供一种使用附加脸部样本来改进人脸检测器的方法,包括使用附加脸部样本构建附加训练集;通过将附加训练集中的所有样本图像转换为灰度级并且缩放到标准大小来对所述样本规一化;将规一化的附加训练集聚类到预定数目的具有近似大小的子训练集,包括在每个所述子训练集的样本彼此相似;对从所述聚类的标准获得的每个子训练集执行以下步骤以形成压缩的训练集通过从所述子训练集去除预定比例的外围样本来对所述子训练集净化,通过选择代表样本分布的样本并将选择的样本添加到缩减的子训练集来缩减子训练集的大小;将由前述步骤获得的子训练集合并到优化的附加训练集;基于所述优化的附加训练集修改人脸检测器的参数;和使用修改的参数基于优化的附加训练集执行人脸检测。 优选为,聚类规一化的附加训练集的步骤包括a)将当前子训练集的数目设置为1,并且将当前子训练集设置为所述附加训练集;b)从当前子训练集选择训练集大小最大的子训练集;c)使用聚类算法将选择的子训练集划分为2个子训练集;d)重复步骤b)和步骤c),直到当前子训练集的数目达到所述预定数目。 优选为,所述对子训练集净化的步骤包括使用概率模型为子训练集建模;和从所述子训练集去除具有低概率的预定比例的样本。 所述概率模型可以是高斯混合模型、高斯模型和相似性模型之一。 优选为,所述缩减子训练集的步骤包括e)在净化的子训练集内,挑选距离高斯中心最近的样本作为种子样本;f)从净化的子训练集去除种子样本,并且将所述种子样本添加到缩减的子训练集;g)将缩减的子训练集的大小设置为种子样本的数目;h)在净化的子训练集中选择距离当前的缩减子训练集最远的样本;i)从净化的子训练集去除选择的样本,并且将其添加到缩减的子训练集;和j)重复步骤h)和i),直到缩减的子训练集的大小达到预定数目。 附图说明 通过下面结合附图对本专利技术的示例性实施例进行的描述,本专利技术的上述和其他目的和特点将会变得更加清楚,其中 图1是示出根据本专利技术示例性实施例的在训练人脸检测器的过程中训练集处理模块的作用的示意图; 图2是示出根据本专利技术示例性实施例的生成用于人脸检测的训练集的过程的示意图; 图3示出根据本专利技术示例性实施例的使用位移(shifting)方法生成的用于训练人脸检测器的样本; 图4示出根据本专利技术示例性实施例的使用翻转(flipping)方法生成的用于训练人脸检测器的样本; 图5示出根据本专利技术示例性实施例的使用旋转(rotating)方法生成的用于训练人脸检测器的样本; 图6示出根据本专利技术示例性实施例的对图像执行规一化(normalization)之前和之后的比较; 图7是示出根据本专利技术示例性实施例的子训练集分类的过程的示意图; 图8示出用于训练人脸检测器的坏样本的示例; 图9示出根据本专利技术示例性实施例的在执行图7的过程之后所得的部分子训练集;和 图10是示出根据本专利技术示例性实施例的具有补充训练集处理模块的改进的人脸检测器的示意图。 具体实施例方式 以下,参照附图来详细说明本专利技术的特定示例性实施例。 根据本专利技术示例性实施例的在如图1示出的人脸检测器中,可以以软件组件(即训练集处理模块)实现。 图1是示出根据本专利技术示例性实施例的在训练人脸检测器的过程中训练集处理模块110的作用的示意图。这里,训练集处理模块110以基础训练集110bs作为输入。根据本专利技术的另一示例性实施例,训练集处理模块110以脸部样本为输入,并且基于所述输入的脸部样本来构建基础训练集。 训练集处理模块110对包括在基础训练集110bs中的样本图像执行图像规一化,并且通过去除外围样本并随后选择代表样本分布的样本来生成压缩(compact)训练集。训练模块120对压缩训练集110cs执行训练以生成人脸检测器130。 图2是示出根据本专利技术示例性实施例的生成用于人脸检测的训练集的过程的示意图。 参照图2,在操作210,基础训练集210s首先被构建。对于脸部区域的图像,通过位移(shifting)、翻转(flipping)和旋转(rotating)所述图像可生成许多训练样本。当图像沿着x和y坐标被位移时,如图3所示,原始脸部区域可以生成4个更多的训练样本。使用翻转方法,如图3所示的包括所述原始脸部区域的5个脸部区域可以生成5个更多的训练样本,如图4所示。当所述原始脸部图像以8个不同的角度被旋转时,又将生成8个训练样本。图5示出通过分别以-37.5°、-30°、本文档来自技高网...

【技术保护点】
一种生成用于人脸检测的训练集的方法,包括: 通过将包括在输入的基础训练集中的所有样本图像转换为灰度级并且缩放到标准大小来对所述图像进行规一化; 将规一化的基础训练集聚类到预定数目的具有近似大小的子训练集,包括在每个所述子训练集的 样本彼此相似;并且 对从所述聚类的标准获得的每个子训练集执行以下步骤以形成压缩的训练集: 通过从所述子训练集去除预定比例的外围样本来对所述子训练集净化, 通过选择代表样本分布的样本并将选择的样本添加到缩减的子训练集来缩减子 训练集的大小。

【技术特征摘要】

【专利技术属性】
技术研发人员:任海兵李宗河金培亭李性德
申请(专利权)人:三星电子株式会社北京三星通信技术研究有限公司
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1