基于遗传算法的人脸样本生成方法技术

技术编号:2931530 阅读:410 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于遗传算法的人脸样本生成方法。该方法对人脸样本集进行编码,然后将编码后的人脸样本集作为遗传算法的初始种群,用一分类器作为适应度函数评价样本的适应度,并进行遗传算法的选择操作、交叉操作和变异操作,以生成新的人脸样本。交叉操作是将样本划分为多个不相重叠的区域,基于交叉概率对两个样本中一选中区域进行交换;变异操作是随机从样本中划分出一个连通区域,基于变异概率对该连通区域进行模拟人脸变化的图像处理。采用本发明专利技术的人脸样本生成方法后,可以在一定数量的原始样本基础上迅速扩张人脸样本数量,从而降低人脸样本收集的工作量。

【技术实现步骤摘要】

本专利技术涉及人脸检测领域,更具体地说,本专利技术涉及静态图像人脸检测过程中人脸样本的生成方法。
技术介绍
静态图像人脸检测是指给定一幅图像,判定其中是否存在人脸,如果有人脸,则返回其坐标和大小。人脸检测的研究因其在身份验证、档案管理和可视化通讯等方面的巨大应用前景,备受研究者关注,成为一个非常活跃的研究领域。在静态图像人脸检测方法中,基于表象(appearance-based)的方法是很重要的一个方法。总的来说,这种方法遵循一种统一的模式,即首先通过学习,在大量人脸和非人脸样本集的基础上训练一个分类器,使得该分类器能对人脸和非人脸样本进行正确的识别,然后对被检测图像进行全局扫描,再利用训练好的分类器在被检测图像中检测人脸。若检测到人脸,则给出人脸所在的位置。采用这种人脸检测方法很重要的一步是需要获得大量的具有代表性的人脸样本来训练分类器。在现有技术中,分类器学习所需要的样本都是通过网络和采集的方式来获得,在简单的对收集到的样本进行一些预处理后,再进行仿射变换,用于增加人脸样本的变化。尽管Lu和Jain利用了Bagging来对已有的样本进行重采样,并重组利用这些子集训练得到的分类器来提高人脸识别率。但是这样做的效果都是有限的,更重要的是如何搜集到丰富的人脸样本。在这方面CMU的Schneiderman做出了一定的努力,他收集了几十万个人脸样本,用于Bayes概率密度函数的估计。但这明显是一项非常繁琐的工作。因此,就需要有一种人脸样本的生成方法能够利用已有的样本通过进一步变换来生成新的人脸样本,从而得到更为丰富的样本,以减少只是单纯地收集需要的样本所遇到的繁琐工作。遗传算法的基本思想是基于Darwin进化论和Mendel的遗传学说的。Darwin进化论最重要的是适者生存原理。它认为每一物种在发展中越来越适应环境。物种每个个体的基本特征由后代所继承,但后代又会产生一些异于父代的新变化。在环境变化时,只有那些能适应环境的个体特征方能保留下来。Mendel遗传学说最重要的是基因遗传原理。它认为遗传以密码方式存在细胞中,并以基因形式包含在染色体内。每个基因有特殊的位置并控制某种特殊性质;所以,每个基因产生的个体对环境具有某种适应性。基因突变和基因杂交可产生更适应于环境的后代。经过存优去劣的自然淘汰,适应性高的基因结构得以保存下来。遗传算法的基本原理长度为L的n个二进制串bi(i=1,2,...,n)组成了遗传算法的初解群,也称为初始群体。在每个串中,每个二进制位就是个体染色体的基因。根据进化术语,对群体执行的操作有三种1.选择(Selection)这是从群体中选择出较适应环境的个体。这些选中的个体用于繁殖下一代。2.交叉(Crossover)这是对两个不同的个体的相同位置的基因进行交换,从而产生新的个体。3.变异(Mutation)这是对个体中的某些基因执行异向转化。在串bi中,如果某位基因为1,产生变异时就是把它变成0;反亦反之。遗传算法的算法可以简要给出如下1)选择一个初始种群;2)评价每个个体的适应度;3)进行选择操作;4)重复步骤5)~8),直至满足某一结束准则5)进行交叉操作;6)进行变异操作;7)评价每个个体的适应度;8)进行选择操作。
技术实现思路
本专利技术的目的是为了充分利用已收集到的人脸样本,基于遗传算法的思想对样本进行变换生成新的样本,从而扩张样本数量。为了实现上述目的,本专利技术提供一种,对人脸样本进行遗传算法的交叉操作而生成新的人脸样本,包括对人脸样本进行编码,然后对编码后的人脸样本进行交叉操作;所述交叉操作包括步骤 a1)将样本按照人脸的组成结构统一划分为多个不相重叠的区域;每一个区域对应样本编码中的一个子串;a2)随机地选择参与交叉操作的两个样本的相同区域,基于交叉概率对选中区域对应的子串进行交换,生成两个新的样本。所述交叉操作为选中一个区域进行交换的单点交叉,或者为选中多个区域进行交换的多点交叉。本专利技术还提供一种,对人脸样本进行遗传算法的变异操作而生成新的人脸样本,包括对人脸样本进行编码,然后对编码后的人脸样本进行变异操作;所述变异操作包括步骤b1)随机从样本中划分出一个连通区域;该连通区域对应样本编码中的一个子串;b2)基于变异概率对该连通区域对应的子串进行模拟人脸变化的图像处理,生成一个新的样本。基于上述的交叉操作和变异操作,本专利技术再提供一种,对人脸样本通过遗传算法生成新的人脸样本,包括步骤1)对初始人脸样本集进行编码;2)将编码后的初始人脸样本集作为遗传算法的初始种群,并对该初始种群中的样本预设一适应度;3)进行遗传算法的交叉操作和变异操作,生成样本的中间解;4)用一训练好的分类器作为适应度函数评价样本的适应度,并根据该适应度进行遗传算法的选择操作,生成新一代群体;5)重复步骤3)和4)进行遗传算法的迭代,直至满足一结束准则。作为上述方法的进一步改进,在重复步骤3)时,交叉操作和变异操作的操作对象为初始种群以及之前生成的各代新群体之和。作为上述方法的进一步改进,在每次重复步骤4)时,都用非人脸样本、初始种群以及之前生成的各代新群体重新训练分类器,并将训练好的分类器作为当前的适应度函数。作为上述方法的进一步改进,所述结束准则为在每次遗传算法的迭代中,都用一校验集测试所述分类器,当分类器的正确检测率在相连多代的变化小于一个预先指定的阈值时,停止遗传算法的迭代。作为上述方法的进一步改进,所述选择操作是根据样本的适应度采用轮盘赌法对样本进行选择。作为上述方法的进一步改进,所述的初始人脸样本是对采集的原始人脸样本经过预处理后得到,该预处理包括对原始人脸样本进行随机的仿射变换。作为上述方法的进一步改进,将初始人脸样本根据其在随机仿射变换中不同的旋转角度划分为多个子集,所述遗传算法的交叉操作、变异操作和选择操作在各子集内部进行。本专利技术利用现有的样本通过遗传算法的处理后,可以扩张人脸样本的数量,比现有的样本具有更丰富的特性。本专利技术通过交叉的方式,可以使得样本具有更多表情变化、佩带物的变化;通过变异来模拟人脸的老化、光照的变化和成像条件的变化。采用本专利技术的人脸样本生成方法后,可以在一定数量的原始样本基础上迅速扩张人脸样本数量,从而降低人脸样本收集的工作量。附图说明图1是本专利技术的流程框图;图2是依据本专利技术的人脸样本生成方法进行样本的交叉和变异的实施例,其中(a)是样本依据人脸的组成划分的实施例,(b)是进行样本交叉的实施例,(c)是进行样本变异的实施例;图3是依据本专利技术的人脸样本生成方法对编码的样本进行交叉和变异的示意图,其中(a)是进行样本交叉的示意图,(b)是进行样本变异的示意图;图4是依据本专利技术的人脸样本生成方法生成的一些新样本;图5是训练分类器SNoW所采用的一种特征表述方式;图6是在遗传算法的迭代过程中采用不同代的样本训练分类器后在校验集上得到的测试结果;图7是根据样本的旋转角度在子集内部进行遗传操作的示意图。具体实施例方式下面结合附图和具体实施方式对本专利技术作进一步详细描述。首先结合图1从总体上对本专利技术作出描述。如图1所示,在步骤101中收集人脸样本,这些样本经步骤102进行预处理。将预处理后的人脸样本分为训练集10和校验集11,其中训练集11也是遗传算法的初始种群,而校验集11在遗本文档来自技高网
...

【技术保护点】
一种基于遗传算法的人脸样本生成方法,对人脸样本进行遗传算法的交叉操作而生成新的人脸样本,包括对人脸样本进行编码,然后对编码后的人脸样本进行交叉操作;所述交叉操作包括步骤:a1)将样本按照人脸的组成结构统一划分为多个不相重叠的区域;每 一个区域对应样本编码中的一个子串;a2)随机地选择参与交叉操作的两个样本的相同区域,基于交叉概率对选中区域对应的子串进行交换,生成两个新的样本。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈杰陈熙霖高文
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利