一种CNN模型的训练方法及装置、人脸识别方法及装置制造方法及图纸

技术编号:17913006 阅读:30 留言:0更新日期:2018-05-10 18:37
本发明专利技术实施例公开了一种CNN模型的训练方法及装置、人脸识别方法及装置。该方案中,对多个浅层特征分别利用CNN模型提取深层特征之后,先将提取的多个特征串行融合,然后对串行融合的特征,进一步以全连接的方式与下一层进行连接,输出图像特征并进行分类,并结合分类结果和标签层对CNN模型的参数进行更新。该方案中,由于对串行融合的特征采用全连接的方式与下一层进行连接,减小了冗余特征的作用,将利于分类的特征提取出来,从而降低了提取特征的冗余性;CNN模型能够实现对特征与标签之间进行端到端的训练,可以自动提取有效特征,减弱冗余特征的作用,将训练得到的CNN模型应用于人脸识别中,可以提高人脸识别效果。

【技术实现步骤摘要】
一种CNN模型的训练方法及装置、人脸识别方法及装置
本专利技术涉及深度学习
,尤其涉及一种CNN模型的训练方法及装置、人脸识别方法及装置。
技术介绍
深层卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种流行的深度学习网络模型,已广泛地应用到人脸识别中。在训练CNN模型时,利用CNN模型对输入的样本图像经过多个卷积层前向传播,进行特征提取,并对提取的特征进行分类得到所属类别的预测分数,将该预测分数与预先输入的标签层的期望分数进行对比得到误差,将该误差在CNN模型中反向传播,对CNN模型的参数进行更新,使得预测分数向期望分数收敛。其中,CNN模型使用的特征提取的卷积层的层数较多,超过一定数量时就称为深层CNN模型,提取的特征称为深层特征。利用训练好的CNN模型提取的特征进行人脸识别时,主要包括身份识别和身份认证两大应用。其中,在身份认证时,将采集图像的特征与一张注册图像的特征进行对比,计算两张图像的特征距离,并通过比较特征距离与预设阈值的大小来判断是否为同一人,例如用户登录的场景中,判断正在登录账户的用户是否是真正认证的用户;在身份识别时,将采集图像的特征与n张注册图像进行对比,判断这个人是谁,例如对罪犯的监控场景中,判断嫌疑人是数据库中录入的多个罪犯中的哪一个。现有的方法在训练深层CNN模型时,有多种训练方式。方式一是仅以灰度图像或RGB图像为输入进行训练,提取深层特征。方式二是分别使用人脸图像的不同位置区域、不同尺度、不同通道(灰度或彩色)的子图像块来训练多个CNN模型,并将多个CNN模型提取的深层特征进行串行融合。方式三是将多种浅层特征进行融合作为CNN的输入,如将灰度特征、梯度特征和方向特征堆叠成3层作为CNN的输入来训练CNN,提取深层特征。方式四是使用多个CNN模型分别对图像的多个浅层特征进一步提取深层特征,并将提取的深层特征通过主成分分析(PrincipleComponentsAnalysis,PCA)算法在特征层进行融合。其中,特征提取的层数小于一定数量称为浅层特征。从以上方式可以看出,都是以灰度特征和一些浅层特征作为深层CNN模型的输入提取深层特征,但是,图像的浅层特征均是由灰度特征衍生或提取而来,提取的深层特征冗余性较高,人脸识别效果不佳。
技术实现思路
本专利技术实施例的目的是提供一种CNN模型的训练方法及装置、人脸识别方法及装置,用于解决现有技术中对图像的浅层特征提取的深层特征冗余性较高,人脸识别效果不佳的问题。本专利技术实施例的目的是通过以下技术方案实现的:一种CNN模型的训练方法,该方法包括:对输入的图像分别提取预设的多个浅层特征;将提取的各个浅层特征分别作为卷积神经网络CNN模型的输入,正向传播提取深层特征;将提取的各个深层特征进行串行融合,得到串行融合的特征;将串行融合的特征所在层的各个神经元结点以全连接的方式与下一相邻的层的各个神经元结点进行连接得到图像特征,将全连接之后得到的图像特征作为输出的图像特征;并对输出的图像特征进行分类得到预测分数;将预测分数与预先输入的标签层的期望分数进行对比,计算误差;以及将所述误差反向传播,更新各个浅层特征对应的CNN模型的参数。较佳地,所述预设的多个浅层特征之间具有互补性。较佳地,所述预设的多个浅层特征包括红绿蓝RGB特征、局部三值模式LTP特征和特征和梯度方向直方图HOG特征。较佳地,将所述误差反向传播,更新各个浅层特征对应的CNN模型的参数,包括:将所述误差在CNN模型中反向传播至串行融合的特征所在层,得到各个浅层特征对应的误差;将各个浅层特征对应的误差在对应的CNN模型中反向传播,更新对应的CNN模型的参数。一种CNN模型的训练装置,该装置包括:特征提取模块,用于对输入的图像分别提取预设的多个浅层特征;将提取的各个浅层特征分别作为卷积神经网络CNN模型的输入,正向传播提取深层特征;将提取的各个深层特征进行串行融合,得到串行融合的特征;将串行融合的特征所在层的各个神经元结点以全连接的方式与下一相邻的层的各个神经元结点进行连接得到图像特征,将全连接之后得到的图像特征作为输出的图像特征;并对输出的图像特征进行分类得到预测分数;更新模块,用于将预测分数与预先输入的标签层的期望分数进行对比,计算误差;以及将所述误差反向传播,更新各个浅层特征对应的CNN模型的参数。较佳地,所述预设的多个浅层特征之间具有互补性。较佳地,所述预设的多个浅层特征包括红绿蓝RGB特征、局部三值模式LTP特征和特征和梯度方向直方图HOG特征。较佳地,所述更新模块,具体用于:将所述误差在CNN模型中反向传播至串行融合的特征所在层,得到各个浅层特征对应的误差;将各个浅层特征对应的误差在对应的CNN模型中反向传播,更新对应的CNN模型的参数。本专利技术实施例的有益效果如下:本专利技术实施例提供的一种CNN模型的训练方法及装置中,对多个浅层特征分别利用CNN模型提取深层特征之后,先将提取的多个特征串行融合,然后对串行融合的特征,进一步以全连接的方式与下一层进行连接,输出图像特征并进行分类,并结合分类结果和标签层对CNN模型的参数进行更新。该方案中,由于对串行融合的特征采用全连接的方式与下一层进行连接,减小了冗余特征的作用,将利于分类的特征提取出来,从而降低了提取特征的冗余性;CNN模型能够实现对特征与标签之间进行端到端的训练,可以自动提取有效特征,减弱冗余特征的作用,将训练得到的CNN模型应用于人脸识别中,可以提高人脸识别效果。一种基于CNN模型的人脸识别方法,该方法包括:对待进行人脸识别的采集图像按照如下特征提取步骤提取图像特征:对输入的图像分别提取预设的多个浅层特征;将提取的各个浅层特征分别作为卷积神经网络CNN模型的输入,提取深层特征;将提取的各个深层特征进行串行融合;将串行融合的特征所在层的各个神经元结点以全连接的方式与下一相邻的层的各个神经元结点进行连接得到图像特征,将全连接之后得到的图像特征作为输出的图像特征;其中的CNN模型是利用以上任一项所述的CNN模型的训练方法预训练得到的;获取预先按照与所述采集图像的特征提取步骤相同的步骤提取的注册图像的图像特征;计算采集图像的图像特征与注册图像的图像特征之间的特征距离;根据计算的特征距离,进行人脸识别。一种基于CNN模型的人脸识别装置,该装置包括:特征提取模块,用于对待进行人脸识别的采集图像按照如下特征提取步骤提取图像特征:对输入的图像分别提取预设的多个浅层特征;将提取的各个浅层特征分别作为卷积神经网络CNN模型的输入,提取深层特征;将提取的各个深层特征进行串行融合;将串行融合的特征所在层的各个神经元结点以全连接的方式与下一相邻的层的各个神经元结点进行连接得到图像特征,将全连接之后得到的图像特征作为输出的图像特征;其中的CNN模型是利用以上任一项所述的CNN模型的训练方法预训练得到的;特征获取模块,用于获取预先按照与所述采集图像的特征提取步骤相同的步骤提取的注册图像的图像特征;计算模块,用于计算采集图像的图像特征与注册图像的图像特征之间的特征距离;识别模块,用于根据计算的特征距离,进行人脸识别。本专利技术实施例的有益效果如下:本专利技术实施例提供的一种基于CNN模型的人脸识别方法及装置中,对多个浅层本文档来自技高网
...
一种CNN模型的训练方法及装置、人脸识别方法及装置

【技术保护点】
一种CNN模型的训练方法,其特征在于,该方法包括:对输入的图像分别提取预设的多个浅层特征;将提取的各个浅层特征分别作为卷积神经网络CNN模型的输入,正向传播提取深层特征;将提取的各个深层特征进行串行融合,得到串行融合的特征;将串行融合的特征所在层的各个神经元结点以全连接的方式与下一相邻的层的各个神经元结点进行连接得到图像特征,将全连接之后得到的图像特征作为输出的图像特征;并对输出的图像特征进行分类得到预测分数;将预测分数与预先输入的标签层的期望分数进行对比,计算误差;以及将所述误差反向传播,更新各个浅层特征对应的CNN模型的参数。

【技术特征摘要】
1.一种CNN模型的训练方法,其特征在于,该方法包括:对输入的图像分别提取预设的多个浅层特征;将提取的各个浅层特征分别作为卷积神经网络CNN模型的输入,正向传播提取深层特征;将提取的各个深层特征进行串行融合,得到串行融合的特征;将串行融合的特征所在层的各个神经元结点以全连接的方式与下一相邻的层的各个神经元结点进行连接得到图像特征,将全连接之后得到的图像特征作为输出的图像特征;并对输出的图像特征进行分类得到预测分数;将预测分数与预先输入的标签层的期望分数进行对比,计算误差;以及将所述误差反向传播,更新各个浅层特征对应的CNN模型的参数。2.根据权利要求1所述的方法,其特征在于,所述预设的多个浅层特征之间具有互补性。3.如权利要求2所述的方法,其特征在于,所述预设的多个浅层特征包括红绿蓝RGB特征、局部三值模式LTP特征和特征和梯度方向直方图HOG特征。4.根据权利要求1所述的方法,其特征在于,将所述误差反向传播,更新各个浅层特征对应的CNN模型的参数,包括:将所述误差在CNN模型中反向传播至串行融合的特征所在层,得到各个浅层特征对应的误差;将各个浅层特征对应的误差在对应的CNN模型中反向传播,更新对应的CNN模型的参数。5.一种基于CNN模型的人脸识别方法,其特征在于,该方法包括:对待进行人脸识别的采集图像按照如下特征提取步骤提取图像特征:对输入的图像分别提取预设的多个浅层特征;将提取的各个浅层特征分别作为卷积神经网络CNN模型的输入,提取深层特征;将提取的各个深层特征进行串行融合;将串行融合的特征所在层的各个神经元结点以全连接的方式与下一相邻的层的各个神经元结点进行连接得到图像特征,将全连接之后得到的图像特征作为输出的图像特征;其中的CNN模型是利用权利要求1~4任一项所述的CNN模型的训练方法预训练得到的;获取预先按照与所述采集图像的特征提取步骤相同的步骤提取的注册图像的图像特征;计算采集图像的图像特征与注册图像的图像特征之间的特征距离;根据计算的特征距离,进行人脸识别。6.一种CNN模型的训练装置...

【专利技术属性】
技术研发人员:程福运郝敬松
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1