一种证件图像的裁切方法、装置、系统及存储介质制造方法及图纸

技术编号:19823851 阅读:41 留言:0更新日期:2018-12-19 15:26
本发明专利技术提供了一种证件图像的裁切方法、装置、系统及存储介质。所述方法包括:获取待裁切的原始证件图像;对原始证件图像进行预处理,得到灰度图像和二值图像;对灰度图像进行边缘线段检测,得到所述灰度图像的边缘线段信息;对所述二值图像进行版面分析,得到二值图像中的文本行的位置信息,并得到对应的证件的位置信息和尺寸信息,并确定对应的证件类型;根据所述证件类型得到对应的检测区域并进行裁切;计算证件的字符朝向并对所述裁切后的证件图像进行旋转;计算所述裁切后的证件图像的倾斜角度,并调整所述裁切后的证件图像,得到裁切后的端正的证件图像。

【技术实现步骤摘要】
一种证件图像的裁切方法、装置、系统及存储介质
本专利技术涉及图像处理领域,尤其涉及证件图像的处理领域,具体的讲是一种证件图像的裁切方法、装置、系统及存储介质。
技术介绍
如今越来越多的行业,如通信行业、酒店、网吧等,都需要对身份证件信息进行采集和登记,以进行实名制。传统的证件识别分类器不仅费时费力,效率低下,且对于大多数的行业的证件采集过程中,在对第二代居民身份证进行采集的基础上,还需要对护照、驾驶证、行驶证等有效证件上的信息进行采集,所以单纯的二代身份证读卡器,已经远远不能满足证件采集的需求,在如今在互联网大数据背景下,利用现代信息技术开展高效快捷便民服务工作,已是大势所趋,也正是在这种大背景下,各类证件识别软件应运而生。如今的证件识别系统,大多数不经过证件图像的裁切和调整,直接识别图像中的字符信息。但是,这种识别方法,由于没有证件的位置,方向或不进行倾斜角度校正,后续分类模块很难对证件类型进行准确的分类,后续识别模块也很容易识别错误。应该注意,上面对技术背景的介绍只是为了方便对本专利技术的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本专本文档来自技高网...

【技术保护点】
1.一种证件图像的裁切方法,其特征在于,包括:获取待裁切的原始证件图像;对所述原始证件图像进行预处理,得到所述原始证件图像的灰度图像,以及对所述灰度图像进行二值化后生成的二值图像;对所述灰度图像进行边缘线段检测,得到所述灰度图像的边缘线段信息,所述边缘线段信息包括边缘水平线段和边缘垂直线段;对所述二值图像进行版面分析,得到所述二值图像中的文本行的位置信息,并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息,并确定对应的证件类型;根据所述证件类型,利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息,得到检测区域并在所述灰度图像中根据所述检测区域进行裁切,得到裁切后的证件图...

【技术特征摘要】
1.一种证件图像的裁切方法,其特征在于,包括:获取待裁切的原始证件图像;对所述原始证件图像进行预处理,得到所述原始证件图像的灰度图像,以及对所述灰度图像进行二值化后生成的二值图像;对所述灰度图像进行边缘线段检测,得到所述灰度图像的边缘线段信息,所述边缘线段信息包括边缘水平线段和边缘垂直线段;对所述二值图像进行版面分析,得到所述二值图像中的文本行的位置信息,并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息,并确定对应的证件类型;根据所述证件类型,利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息,得到检测区域并在所述灰度图像中根据所述检测区域进行裁切,得到裁切后的证件图像;根据所述证件的位置信息,对所述裁切后的证件图像中的字符朝向进行判定,并根据所述字符朝向对所述裁切后的证件图像进行旋转;对所述旋转后的裁切后的证件图像进行版面分析,计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度,并根据所述倾斜角度调整所述裁切后的证件图像,得到裁切后的端正的证件图像。2.根据权利要求1所述的证件图像的裁切方法,其特征在于,所述对所述灰度图像进行边缘线段检测,得到所述灰度图像的边缘线段信息,所述边缘线段信息包括边缘水平线段和边缘垂直线段,具体包括:利用LSD检线算法或ED检线算法对所述灰度图像进行边缘线段检测,得到所述灰度图像的所有边缘线段;对所述所有边缘线段进行合并,并分类为所述边缘水平线段和边缘垂直线段。3.根据权利要求1所述的证件图像的裁切方法,其特征在于,所述对所述二值图像进行版面分析,得到所述二值图像中的文本行的位置信息,并根据所述文本行的位置信息得到对应的证件的位置信息和尺寸信息,并确定对应的证件类型,具体包括:对所述二值图像进行版面分析,得到所述二值图像中的文本行的位置信息,所述文本行的位置信息包括文本行的区域坐标以及文本行中每个字符的区域坐标;根据所述文本行的位置信息判断所述证件的位置信息为水平放置还是竖直放置;根据所述文本行的位置信息,计算外包区域,判断所述证件的尺寸大小;根据所述文本行的位置信息,判断所述证件是否是机读码类证件。4.根据权利要求3所述的证件图像的裁切方法,其特征在于,所述根据所述证件类型,利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息,得到检测区域并在所述灰度图像中根据所述检测区域进行裁切,得到裁切后的证件图像,具体包括:如果所述证件类型为机读码类证件,则所述文本行的位置信息包括机读码的位置和长度,且得到裁切后的证件图像的步骤包括:根据所述机读码的位置和长度,按比例映射出证件的大致区域;在所述大致区域对应四边的小范围内,分别寻找长度最长的线段,四边围成的区域就是检测到的区域,如果四边中某边找不到满足长度要求的线段,取所述大致区域的此边边界作为检测到的区域。5.根据权利要求3所述的证件图像的裁切方法,其特征在于,所述根据所述证件类型,利用所述边缘线段信息、文本行的位置信息、证件的位置信息和尺寸信息,得到检测区域并在所述灰度图像中根据所述检测区域进行裁切,得到裁切后的证件图像,具体包括:如果证件类型为非机读码类证件,则得到裁切后的证件图像的步骤包括:配对所述边缘水平线段和边缘竖直线段,如果两个水平线段或者两个竖直线段之间的距离大于设定的最小证件距离,则进行配对,分别得到水平线段和竖直线段的配对集合;将所有水平线段和竖直线段的配对集合组合成区域集合,对不满足证件尺寸的区域集合进行过滤,得到初始区域集合Rsrc;分别计算所述初始区域集合Rsrc的评分,取评分最高的区域为所述检测区域,其中评分的公式为:Score=50*(区域四条线段的区域内部截取长度之和-区域四条线段的区域外部截取长度之和)/区域周长+50*(区域内字符连通域的个数/连通域总数)。6.根据权利要求5所述的证件图像的裁切方法,其特征在于,所述根据所述证件的位置信息,对所述裁切后的证件图像中的字符朝向进行判定,并根据所述字符朝向对所述裁切后的证件图像进行旋转,具体包括:当所述证件的位置信息为竖直放置时,对所述裁切后的证件图像进行90度顺时针旋转,得到水平图像;对所述水平图像进行180度旋转得到翻转图像;对所述水平图像进行连通域分析,得到各字符区域;分别对所述各字符区域内对应的水平图像和翻转图像进行识别,统计并比较满足置信度要求的个数,如果所述水平图像中满足置信度要求的个数大于所述翻转图像,则所述裁切后的证件图像中的字符为朝上,否则字符为朝下;如果所述裁切后的证件图像为竖直图像,且为字符朝上,则方向为朝左,否则为朝右。7.根据权利要求6所述的证件图像的裁切方法,其特征在于,所述对所述旋转后的裁切后的证件图像进行版面分析,计算所有文本行的倾斜角度的平均值作为所述裁切后的证件图像的倾斜角度,并根据所述倾斜角度调整所述裁切后的证件图像,得到裁切后的端正的证件图像,具体包括:对所述旋转后的裁切后的证件图像进行版面分析,得到对应的文本行信息;对具有多个字符个数的文本行,利用文本行第一个和最后一个字符的中心点位置,计算倾斜角度;计算所有文本行的倾斜角度的平均值,作为所述裁切后的证件图像的倾斜角度。8.一种证件图像的裁切装置,其特征在于,包括:获取模块,用于获取待裁切的原始证件图像;预处理模块,用于对所述原始证件图像进行预处理,得到所述原始证件图像的灰度图像,以及对所述灰度图像进行二值化后生成的二值图像;线段检测模块,用于对所述灰度图像进行边缘线段检测,得到所述灰度图像的边缘线段...

【专利技术属性】
技术研发人员:易爱春杨超
申请(专利权)人:北京中安未来科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1