一种基于增量学习人脸分块视觉表征的视频人脸识别方法技术

技术编号：9113710 阅读：169 留言：0更新日期：2013-09-05 02:55

本发明专利技术提供了一种基于增量学习人脸分块视觉表征的视频人脸识别方法，属于模式识别领域。本方法使用Adaboost算法在人脸视频第一帧的正面人脸图像进行检测，使用Camshift算法进行跟踪，得到所有人脸图像，在读入视频过程中，对人脸图像进行增量聚类，并从每类人脸图像中选取代表；对代表图像进行处理，学习基于块视觉表征的视觉词典；使用视觉词典对人脸图像进行表征；最后根据相似矩阵对人脸图像构成的视频进行识别。本发明专利技术方法能够提高视频人脸在光照、姿态，以及跟踪结果不理想状态下的识别率和鲁棒性，能够有效、便捷、自动地检测、跟踪和识别视频中的人脸。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于增量学习人脸分块视觉表征的视频人脸识别方法
本专利技术属于模式识别领域，涉及图像处理和计算机视觉等技术，特别是基于增量学习人脸分块视觉表征的人脸识别方法。
技术介绍
视频中的人脸识别主要是针对包含人的运动图像序列进行分析处理，人脸识别问题可以定义成：输入（查询）场景中的静止图像或者视频，使用人脸数据库识别或验证场景中的一个人或者多个人。基于静止图像的人脸识别通常是指输入（查询）一幅静止的图像，使用人脸数据库进行识别或验证图像中的人脸。而基于视频的人脸识别是指输入（查询）一段视频，使用人脸数据库进行识别或验证视频中的人脸。类别是世间万物的一个基本属性，同一类别的事物在形状，行为等方面具有相似的特性，而不同类别的物体则往往具有较大的差异。对于计算机而言，如何自动地从监控视频中判断出运动目标的类别是一个很具挑战性的问题。国内外众多的大学和研究机构，如美国的MIT、CMU、UIUC、Maryland大学、英国的剑桥大学、日本的Toshiba公司和国内的中国科学院自动化所都对基于视频的人脸识别进行了广泛而深入的研究。视频中的人脸的图像特征一般使用矢量或者矩阵作为描述方式。利用矢量作为视频人脸的描述方式的基本思想是利用视频得到一个反映输入人脸视频特性（如均值人脸图像、最好的正面图像等）的特征（矢量表示），和数据库中的人脸视频描述方式进行匹配。数据库中人脸视频的描述方式可以是矢量、矩阵、概率、动态模型、流形等。目前已经有很多算法对视频场景内的人脸识别（分类）进行了研究，但是往往都存在着一定的缺点，例如，需要进行数据库的采集标注，需要重新训练训练样本，不能增量更新...
一种基于增量学习人脸分块视觉表征的视频人脸识别方法

【技术保护点】
一种基于增量学习人脸分块视觉表征的视频人脸识别方法，其特征在于，包括如下步骤：步骤S1：对读入的一段时间的人脸图像序列，使用Adaboost算法对第一帧的正面人脸图像进行检测，得到目标人脸，使用Camshift算法对人脸图像序列进行处理，跟踪得到所有人脸图像；步骤S2：在读入人脸图像序列的过程中，对通过人脸目标检测和人脸运动跟踪获得的人脸图像进行增量聚类；步骤S3：增量聚类过程中，对增量聚类得到的每一类人脸图像中，选取该类的代表；步骤S4：将所有选出的人脸图像都进行矩形块分割；步骤S5：对人脸图像分割的每个矩形块提取特征向量；步骤S6：对提取出来的所有特征向量，使用vector?quantization算法进行分类，学习人脸视觉词汇，将学习到的所有视觉词汇统计起来，形成人脸视觉词汇词典；步骤S7：通过空间金字塔匹配方法，使用人脸视觉词汇对人脸图像进行表征，人脸图像表示为由人脸视觉词汇表示的直方图；在训练阶段，将训练视频集中选取的作为代表的人脸图像都使用人脸视觉词汇表征；在识别阶段，将测试视频中的每帧测试图像都经过步骤S4到步骤S7的处理，用人脸视觉词汇表征；步骤S8：通过时序相似矩阵对...

【技术特征摘要】
1.一种基于增量学习人脸分块视觉表征的视频人脸识别方法，其特征在于，包括如下步骤：步骤S1：对读入的一段时间的人脸图像序列，使用Adaboost算法对第一帧的正面人脸图像进行检测，得到目标人脸，使用Camshift算法对人脸图像序列进行处理，跟踪得到所有人脸图像；步骤S2：在读入人脸图像序列的过程中，对通过人脸目标检测和人脸运动跟踪获得的人脸图像进行增量聚类；步骤S3：增量聚类过程中，对增量聚类得到的每一类人脸图像中，选取该类的代表；步骤S4：将所有选出的人脸图像都进行矩形块分割；步骤S5：对人脸图像分割的每个矩形块提取特征向量；步骤S6：对提取出来的所有特征向量，使用vectorquantization算法进行分类，学习人脸视觉词汇，将学习到的所有视觉词汇统计起来，形成人脸视觉词汇词典；步骤S7：通过空间金字塔匹配方法，使用人脸视觉词汇对人脸图像进行表征，人脸图像表示为由人脸视觉词汇表示的直方图；在训练阶段，将训练视频集中选取的作为代表的人脸图像都使用人脸视觉词汇表征；在识别阶段，将测试视频中的每帧测试图像都经过步骤S4到步骤S7的处理，用人脸视觉词汇表征；步骤S8：通过时序相似矩阵对测试视频的每帧人脸图像进行识别，实现方法为：步骤8.1：对测试视频中每帧测试图像，计算该测试图像用人脸视觉词汇表示的特征，到训练视频集中各代表人脸图像用人脸视觉词汇表示的特征的余弦相似距离，得到相似距离矩阵；测试图像特征ft到训练视频集中第j个人第k个类代表人脸图像特征fkj的余弦相似距离dkj为：dkj＝ρ(ft,fkj),k＝1,...,Cj，其中，Cj为第j个人的类代表的个数，ρ表示余弦相似距离计算，步骤S8中所述的图像特征是指图像用人脸视觉词汇表示的特征；步骤8.2：通过相似距离矩阵，确定测试图像与训练视频集中每个人的相似距离，对相似距离赋予权重，得到测试图像与第j个人的身份得分；测试图像与训练视频集中第j个人的相似距离sj为：其中，表示测试图像特征到训练视频集中第j个人所有类代表人脸图像特征的余弦相似距离的最大值，表示测试图像特征距离训练视频集中第j个人所有类代表人脸图像特征的余弦相似距离的最小值；对相似距离sj赋予权重Wj，得到测试图像与第j个人的身份得分scorej：scorej＝α(Wjsj-β)...

【专利技术属性】
技术研发人员：张兆翔，王超，王蕴红，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人