基于深度自编码器的人眼检测和定位方法技术

技术编号：12625984 阅读：136 留言：0更新日期：2015-12-31 19:37

本发明专利技术公开了一种用于人眼检测和定位的方法，包括：对带有标定好的人眼矩形框位置的训练集中的所有图像，利用人眼矩形框位置生成二值化的标签图；在图像上随机取小图像块，无监督地分层训练多个自编码器以构建深度自编码器，并利用自编码器中各层的权重对深度自编码器进行初始化；在原图像和标签图的相同位置上随机取小原图像块和小标签图像块，以小标签图像块作为监督信息，以小原图像块为输入，优化深度自编码器；在待测图像上以滑动窗口的方式生成多个小待测图像块，利用深度自编码器得到每个小待测图像块的小待测标签图像块并将其合并在一起，得到待测图像的待测标签图，对待测标签图进行二值化，利用坐标投影或寻找轮廓得到人眼的位置。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别与机器学习领域，特别涉及图像目标检测。更具体地，本专利技术涉及。
技术介绍
生物特征识别技术应用的爆炸式增长和生物特征识别算法向嵌入式和移动平台移植的巨大需求使得快速的人眼检测和定位显得日趋重要。传统的目标检测算法是通过构建图像的特征金字塔，并在金字塔上滑动地提取窗口，对提取的窗口进行分类，最后通过非最大化抑制操作得到目标的位置。尽管这种方法在简单背景下取得了较好的检测效果，同时在普通电脑上能够达到实时，但是这种方法不能很好地处理复杂背景下的目标检测以及目标存在形变、视角变化和遮挡等问题，并且在嵌入式和移动平台上很难达到实时。此外，当前基于深度卷积神经网络的目标检测方法取得了较高的检测精度，并且能够非常好地处理复杂背景以及目标存在形变和视角变化的问题，但是由于其计算量十分巨大，即使借助并行计算技术，也很难达到实时性的要求。
技术实现思路
本专利技术提供了一种基于深度自编码器的快速人眼检测和定位方法。本专利技术的一个方面提供了一种生成用于人眼检测和定位的深度自编码器的方法，其特征在于，该方法包括以下步骤：步骤S0 :将带有标定好的人眼矩形框位置的图像的集合作为训练集；步骤S1 :对训练集中的所有图像，利用标定好的人眼矩形框位置生成二值化的标签图；步骤S2:在训练集中的图像上随机取小图像块，无监督地分层训练多个自编码器；步骤S3 :利用步骤S2中分层训练的多个自编码器构建一个深度自编码器，并利用分层训练得到的自编码器中各层的权重对构建的深度自编码器进行初始化；以及步骤S4 :在训练集中...

【技术保护点】
一种生成用于人眼检测和定位的深度自编码器的方法，其特征在于，该方法包括以下步骤：步骤S0：将带有标定好的人眼矩形框位置的图像的集合作为训练集；步骤S1：对训练集中的所有图像，利用标定好的人眼矩形框位置生成二值化的标签图；步骤S2：在训练集中的图像上随机取小图像块，无监督地分层训练多个自编码器；步骤S3：利用步骤S2中分层训练的多个自编码器构建一个深度自编码器，并利用分层训练得到的自编码器中各层的权重对构建的深度自编码器进行初始化；以及步骤S4：在训练集中的原图像和标签图的相同位置上随机取小原图像块和小标签图像块，以小标签图像块作为监督信息，以小原图像块为输入，使用反向传播算法优化深度自编码器。

【技术特征摘要】

【专利技术属性】
技术研发人员：王亮，黄永祯，唐微，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人