证件图像检测方法及设备技术

技术编号:13457811 阅读:72 留言:0更新日期:2016-08-03 16:11
本申请提供一种证件图像检测方法及设备,本申请通过训练好的证件检测器检测出证件图像在待检测图像中的位置,与传统的基于边缘的身份证检测算法相比,本申请基于机器学习的算法更加鲁棒,且能够处理证件图像的背景复杂的问题。另外,本申请通过对所述待检测图像校正角度,从而实现对旋转的待检测图像进行证件图像所在位置的更精确的检测。

【技术实现步骤摘要】

本申请涉及通信及计算机领域,尤其涉及一种证件图像检测方法及设备
技术介绍
目前在一些网站身份认证程序中,需要获取用户手持其证件的照片,后续需要从照片中自动检测证件在照片中的位置,以为后续的证件信息的识别提供技术基础。例如,在某一购物网站,卖家进行开店实名认证的时候需要上传自己的手持身份证的照片,然后需要在卖家的手持身份证的照片中自动检测身份证的位置,以在认证的时候展示身份证特写给卖家,让卖家自行检测身份证是否模糊,从而提高审核的一次性通过率,另外,检测出身份证的区域也为后续的身份证信息的识别提供技术基础。但是传统的基于边缘的证件检测算法只适用于背景比较简单的图像。对于背景比较复杂,这种现有的方法往往会有许多误检的区域。另外,当原始的图像有旋转时,传统的方法往往无法检测到身份证。
技术实现思路
本申请的目的是提供一种证件检测方法及系统,解决目前存在的无法检测到证件或证件所在区域误检的问题。有鉴于此,本申请提供一种证件图像检测方法,包括:基于MB-LBP特征训练由多个强分类器级联成的证件检测器;通过所述证件检测器检测待检测图像中的证件图像。进一步的,基于MB-LBP特征训练由多个强分类器级联成的证件检测器包括:获取多个证件图像和非证件图像分别作为正样本和负样本;从正样本和负样本中随机选择不同的区域,分别提取不同的区域的MB-LBP特征;基于不同的区域的MB-LBP特征训练由多个强分类器级联成的证件检测器。进一步的,基于不同的区域的MB-LBP特征训练由多个强分类器级联成的证件检测器包括:基于不同的区域的MB-LBP特征并使用gentleAdaboost策略进行特征选择,根据选择的特征生成每个由多个多分支回归树弱分类器组成的强分类器;使用cascadeAdaboost策略将多个强分类器级联成的证件检测器。进一步的,分别提取不同的区域的MB-LBP特征包括:分别将每个区域划分为若干个子区域,计算每个子区域的像素均值;通过比较每个区域内的中心子区域的像素均值与周围子区域的像素均值获得每个区域的二进制编码的MB-LBP特征;将每个区域的二进制编码MB-LBP特征转化成十进制的MB-LBP特征。进一步的,基于不同的区域的MB-LBP特征并使用gentleAdaboost策略进行特征选择,根据选择的特征生成每个由多个多分支回归树弱分类器组成的强分类器包括:重复下述步骤直至当前强分类器中的多分支回归树弱分类器的个数是否达到预设的个数,并输出生成的强分类器:根据正样本和负样本的数量设置每个正样本或负样本的权重,初始化强分类器;基于不同的区域的十进制的MB-LBP特征和正样本或负样本的权重训练得到对应的多分支回归树弱分类器;从多分支回归树弱分类器中选择具有最小损失的多分支回归树弱分类器加入强分类器;根据选择得到的多分支回归树弱分类器更新正样本和负样本的权重。进一步的,基于不同的区域的十进制的MB-LBP特征和正样本或负样本的权重训练得到对应的多分支回归树弱分类器包括:基于不同的区域的十进制的MB-LBP特征和正样本或负样本的权重得到第一损失函数;通过第一损失函数最小化后训练得到对应于不同的区域的十进制的MB-LBP特征的每个多分支回归树弱分类器。进一步的,所述第一损失函数表示如下: J loss ( x i LBP , f m ( x i LBP ) ) = Σ i = 1 N w i ( y i - f m ( x i LBP ) ) 2 , ]]>其中,fm(xiLBP)表示第m个弱分类器,N表示正样本和负样本的数量,xiLBP表示第i个正样本或负样本的区域的十进制的MB-LBP特征,yi表示样本的类型,为正样本时yi=1,为负样本时yi=-1,wi表示当前第i个正样本或负样本的权重,fm(xiLBP)采用多分支树,fm(xiLBP)定义如下: f m ( x i LBP ) = a 0 x LBP = 0 · · · · · · a j x 本文档来自技高网...

【技术保护点】
一种证件图像检测方法,其中,包括:基于MB‑LBP特征训练由多个强分类器级联成的证件检测器;通过所述证件检测器检测待检测图像中的证件图像。

【技术特征摘要】
1.一种证件图像检测方法,其中,包括:
基于MB-LBP特征训练由多个强分类器级联成的证件检测器;
通过所述证件检测器检测待检测图像中的证件图像。
2.如权利要求1所述的方法,其中,基于MB-LBP特征训练由多个
强分类器级联成的证件检测器包括:
获取多个证件图像和非证件图像分别作为正样本和负样本;
从正样本和负样本中随机选择不同的区域,分别提取不同的区域的
MB-LBP特征;
基于不同的区域的MB-LBP特征训练由多个强分类器级联成的证件
检测器。
3.如权利要求2所述的方法,其中,基于不同的区域的MB-LBP特
征训练由多个强分类器级联成的证件检测器包括:
基于不同的区域的MB-LBP特征并使用gentleAdaboost策略进行特
征选择,根据选择的特征生成每个由多个多分支回归树弱分类器组成的
强分类器;
使用cascadeAdaboost策略将多个强分类器级联成的证件检测器。
4.如权利要求3所述的方法,其中,分别提取不同的区域的MB-
LBP特征包括:
分别将每个区域划分为若干个子区域,计算每个子区域的像素均
值;
通过比较每个区域内的中心子区域的像素均值与周围子区域的像素
均值获得每个区域的二进制编码的MB-LBP特征;
将每个区域的二进制编码MB-LBP特征转化成十进制的MB-LBP特
征。
5.如权利要求4所述的方法,其中,基于不同的区域的MB-LBP特
征并使用gentleAdaboost策略进行特征选择,根据选择的特征生成每个
由多个多分支回归树弱分类器组成的强分类器包括:
重复下述步骤直至当前强分类器中的多分支回归树弱分类器的个数
是否达到预设的个数,并输出生成的强分类器:
根据正样本和负样本的数量设置每个正样本或负样本的权重,初始
化强分类器;
基于不同的区域的十进制的MB-LBP特征和正样本或负样本的权重
训练得到对应的多分支回归树弱分类器;
从多分支回归树弱分类器中选择具有最小损失的多分支回归树弱分
类器加入强分类器;
根据选择得到的多分支回归树弱分类器更新正样本和负样本的权
重。
6.如权利要求5所述的方法,其中,基于不同的区域的十进制的
MB-LBP特征和正样本或负样本的权重训练得到对应的多分支回归树弱
分类器包括:
基于不同的区域的十进制的MB-LBP特征和正样本或负样本的权重
得到第一损失函数;
通过第一损失函数最小化后训练得到对应于不同的区域的十进制的
MB-LBP特征的每个多分支回归树弱分类器。
7.如权利要求6所述的方法,其中,所述第一损失函数表示如下:
J loss ( x i LBP , f m ( x i LBP ) ) = Σ i = 1 N w i ( y i - f m ( x i LBP ) ) 2 , ]]>其中,fm(xiLBP)表示第m个弱分类
器,N表示正样本和负样本的数量,xiLBP表示第i个正样本或负样本的区
域的十进制的MB-LBP特征,yi表示样本的类型,为正样本时yi=1,为负
样本时yi=-1,wi表示当前第i个正样本或负样本的权重,fm(xiLBP)

\t采用多分支树,fm(xiLBP)定义如下:
f m ( x i LBP ) = a 0 x LBP = 0 . . . . . . a j x LBP = j . . . . . . a 255 x LBP = 255 . ]]>8.如权利要求7所述的方法,其中,通过第一损失函数最小化后训
练得到对应于不同的区域的十进制的MB-LBP特征的每个多分支回归树
弱分类器中,
通过最小化Jloss(xLBP,fm(xiLBP))求得即fm(xiLBP)。
9.如权利要求8所述的方法,其中,根据选择得到的多分支回归树
弱分类器更新正样本和负样本的权重中,所述权重根据下式更正:
w i = w i exp ( - y i f m ( x LBP i ) ) Σ i w i exp ( - y i f m ( x LBP i ) ) . ]]>10.如权利要求1至9任一项所述的方法,其中,通过所述证件检测
器检测待检测图像中的证件图像之前还包括:
对所述待检测图像校正角度。
11.如权利要求10所述的方法,其中,对所述待检测图像校正角度
包括:
训练ImageNet模型;
获取多种旋转角度的证件图像训练样本,使用所述ImageNet模型提
取每个证件图像训练样本的高层语义特征;
使用线性支撑向量机对证件图像训练样本的高层语义特征进行训练
得到确定图像旋转角度的分类器;
通过所述分类器确定一待检测图像的旋转角度,根据待检测图像的

\t旋转角度调整该待检测图像的角度。
12.如权利要求11所述的方法,其中,训练ImageNet模型包括:
将ImageNet数据库中的样本图像缩放到相同的分辨率;
将所述样本图像进行减均值操作;
对减均值操作后的样本图像进行随机裁切到统一尺寸;
设置ImageNet模型的神经网络为依次连接的卷积层和全连接层;
随机裁切后的样本图像在神经网络前向传播,计算出ImageNet模型
的待优化的参数的损失值;
根据所述待优化的参数的损失值在所述神经网络上通过链式求导法
反向逐层求待优化的参数的梯度,根据求得的梯度并使用随机梯度下降算
法对所述待优化的参数进行优化以得到优化参数后的ImageNet模型。
13.如权利要求12所述的方法,其中,计算出ImageNet模型的待优
化的参数的损失值中,所述待优化的参数的损失值J(θ)根据如下第二损失
函数获取,
J ( θ ) = - 1 n [ Σ i = 1 n Σ j = 1 k 1 ( y ( i ) = j ) log e x i j Σ l = 1 k e x i j ] , ]]>其中,θ表示待优化的参数,n表
示样本图像的数量,k表示输出类别的个数,表示第i个样本最后一个
全连接层第j个类别的输出值。
14.如权利要求13所述的方法,其中,根据所述待优化的参数的损
失值在所述神经网络上通过链式求导法反向逐层求待优化的参数的梯度
中,根据如下公式求得待优化的参数的梯度:
g t + 1 = 0.9 · g t - 0.0005 · η · θ t - η ⟨ ∂ J ( θ ) ∂ θ | θ t ⟩ , ]]>其中,gt表示第t次迭代的待优化的参数的梯度,gt+1表示第t+1次迭
代的所述待优化的参数的梯度,θt表示第t次迭代的待优化的参数,
表示第二损失函数J(θ)对当前待优化的参数θ=θt时的梯度,
0.9·gt表示惯性动量,0.0005·θt是对θ的正则化约束,η表示学习率。
15.如权利要求14所述的方法,其中,根据求得的梯度并使用随机梯
度下降算法对所述待优化的参数进行优化以得到优化参数后的ImageNet模
型中,通过如下公式对所述待优化的参数进行优化:
θt+1=θt+gt+1,其中,θt+1表示第t+1次迭代的待优化的参数。
16.如权利要求12所述的方法,其中,使用所述ImageNet模型提取
每个证件图像训练样本的高层语义特征包括:
将证件图像训练样本缩放到与ImageNet模型中随机裁切后的样本图
像相同的尺寸;
将缩放后的证件图像训练样本进行减均值操作;
使用所述优化参数后的ImageNet模型提取减均值操作后的每个证件
图像训练样本的所述全连接层高层语义特征;
将每个证件图像训练样本的高层语义特征进行稀疏化操作,并采用
二范数将经过稀疏化操作的高层语义特征进行归一化操作。
17...

【专利技术属性】
技术研发人员:陈岳峰
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1