一种WEB端智能检验证照采集的方法及装置制造方法及图纸

技术编号:37137739 阅读:19 留言:0更新日期:2023-04-06 21:39
本发明专利技术公开了一种WEB端智能检验证照采集的方法及装置,涉及证照安全技术,针对现有技术中对证照质量检验不足的问题提出本方案。主要通过OCR识别算法和OpenCV识别算法对大量样本进行提取,经过训练得到具有评分策略的AI模型实现。对用户上传的证照进行智能化检测,实时照片或已存照片均能适用。优点在于引入了系统评分机制,通过多维度的统计分析数据,有效解决了证照占比过大过小、证照模糊、证照倾斜摆放、证照复印件、证照翻拍的问题,大大提高了证照有效率,减轻了审查工作人员的工作,节约了审核工作人员、系统用户的宝贵时间,提高了工作效率。工作效率。工作效率。

【技术实现步骤摘要】
一种WEB端智能检验证照采集的方法及装置


[0001]本专利技术涉及证照安全技术,尤其涉及一种WEB端智能检验证照采集的方法及装置。

技术介绍

[0002]在证照管理领域,目前市面上主流的做法主要分为两种,一是:实时采集用户的证照,要求用户实时调起摄像头,进行拍照上传,系统调起摄像头时,会显示一个提示框,提示证照刚好占满提示框,用户拍摄后,上传到系统服务器,系统服务器通过使用OCR技术对证照进行识别,提取证照的关键信息,进一步核对信息是否有效。这种方式存在很大的缺陷,1、要求用户实时拍摄,不支持上传已有的证照,造成用户使用不便;2、系统显示的提示框,只是提示作用,并没有进行校验,用户可以随意拍摄证照,而系统并没有校验证照是否刚好占满提示框这个条件。二是:要求用户上传已存在的证照至系统服务器,系统服务器通过使用OCR技术对证照进行识别,提取证照的关键信息,进一步核对信息是否有效。
[0003]由此可见,上述两种方式均存在较为明细的缺陷

没有校验证照是否满足证照管理要求,增加了人工审核校验环节。上述两种方式只要解决了证照的关键信息的提取和校验,并没有解决证照是否满足证照管理系统的诉求,例如:证照在照片中占比过大过小,证照清晰度是否满足条件、证照的是否倾斜、证照来源于复印件、翻拍。
[0004]所述证照是包含证件内容的照片。

技术实现思路

[0005]本专利技术目的在于提供一种WEB端智能检验证照采集的方法及装置,以解决上述现有技术存在的问题。
[0006]本专利技术中所述一种WEB端智能检验证照采集的方法包括以下三个阶段:
[0007]训练阶段:训练库采集训练样本;服务器利用OCR识别算法和OpenCV识别算法对训练样本进行识别然后存储在所述训练库;训练库对训练样本进行面积占比训练、清晰度训练、证照摆放斜率训练以及进行关键信息有效性的检验,统计训练后的数据,确定评分基准值,根据所述评分基准值确定评分策略,完成训练阶段;
[0008]采集阶段:用户通过用户端选择或实时拍摄证照,通过web端上传至所述服务器;服务器利用OCR识别算法和OpenCV识别算法对证照进行信息提取并发送至训练库;训练库对证照进行面积占比计算、清晰度计算、证照摆放斜率计算以及进行关键信息有效性的检验,将结果返回至服务器;服务器得出多维度计算值;
[0009]校验阶段:服务器调取训练库的评分基准值和评分策略对所述多维度计算值进行评分阈值检验,若评分低于阈值则通过web端向用户端提示不通过原因并提示用户端重新操作,若评分不低于阈值则对证照评分进行有效性检测;若有效性检测不通过则通过web端向用户端提示不通过原因并提示用户端重新操作,若有效性检测通过则通过web端向用户端提示证照采集完成。
[0010]面积占比为证件中的头像栏、出生年月栏、性别栏、公民身份证号码栏其中一种的
面积或多种的面积与照片面积的比值。
[0011]在面积占比训练和面积占比计算中,还判断证件距离比例信息;
[0012]照片的垂直距离比例为:R(垂直)=(y

0)/H;
[0013]照片的水平距离比例为:R(水平)=(x

0)/W;
[0014]照片左上角为坐标原点,人头像栏左上角坐标为P(x,y),H为照片高度,W为照片宽度。
[0015]当R(垂直)大于基准值时判断证件水平偏下,当R(垂直)小于基准值时判断证件水平偏上;R(水平)大于基准值时判断证件水平偏右,当R(水平)小于基准值时判断证件水平偏左。
[0016]证照摆放斜率具体为:
[0017]k=|(y6

y2)/(x6

x2)|;
[0018]姓名栏左上角的坐标为(x2,y2),公民身份证号码栏左上角的坐标为(x6,y6);
[0019]当x6不等于x2时计算证照摆放斜率k,k越大表示照片倾斜度越大,k越小表示照片倾斜度越低;
[0020]当x6等于x2时,判断证件没有倾斜。
[0021]本专利技术所述一种WEB端智能检验证照采集的装置,利用所述方法进行证照采集和检验。
[0022]本专利技术中所述一种WEB端智能检验证照采集的方法及装置,其优点在于,基于OCR技术和OpenCV技术识别、提取证照的关键信息、以及照片的属性信息。通过大量的证照数据进行模型训练,得到一组满足需求的评分基准值,服务器对用户上传的证照进行OCR识别、提取数据、进行评分,得到的评分值与AI模型评分基准值进行比较,根据比较结果判断证照是否有效。引入了系统评分机制,通过多维度的统计分析数据,有效解决了证照占比过大过小、证照模糊、证照倾斜摆放、证照复印件、证照翻拍的问题,大大提高了证照有效率,减轻了审查工作人员的工作,节约了审核工作人员、系统用户的宝贵时间,提高了工作效率。
附图说明
[0023]图1是本专利技术中所述一种WEB端智能检验证照采集的方法流程图。
具体实施方式
[0024]如图1所示,本专利技术中所述一种WEB端智能检验证照采集的装置包括用户端、web端、服务器和训练库,其中web端可以是浏览器。用户在用户端通过浏览器与服务器进行通讯。训练库用于通过大量的训练样本进行训练得到AI模型,以及后续利用AI模型进行计算得到多维度计算值。服务器主要用于AI模型的调度和检验判断。各功能模块具体工作流程即为本专利技术所述一种WEB端智能检验证照采集的方法。
[0025](一)模型训练阶段的步骤
[0026]1.开始训练指定证照模型,在本实施例中以以身份证证照为例。本领域技术人员根据公知常识可知,证照还可以包括驾驶证、护照、户口簿、律师证等等。
[0027]2.采集足够多的证照原始数据,为了更好训练数据模型,随机采集足够多的证照原始样例。样例应该包括证照占比过大过小、证照模糊、证照倾斜摆放、证照复印件、证照翻
拍等实际应用可能出现的情况样例。
[0028]3.使用OCR技术对证照进行识别和提取关键信息,采集到标准格式的证照。
[0029]OCR识别并提取关键信息,所述关键信息包括但不限于:姓名、性别、民族、出生年月、住址、身份证号码、人头像各模块,以及所述各模块的左上角的点坐标、长高,整体照片的长高等。
[0030]提取到的关键信息如下:
[0031]照片的左上角坐标O(0,0),相当于坐标原点,照片的长度:W,照片的高度:H,证件的长度:w,证件的高度:h。
[0032]人头像栏的左上角坐标P(x,y),人头像栏的长度:w1,人头像栏的高度:h1。
[0033]姓名栏的左上角坐标N(x2,y2),姓名栏的长度:w2,姓名栏的高度:h2。
[0034]性别栏的左上角坐标S(x3,y3),性别栏的长度:w3,性别栏的高度:h3。
[0035]民族栏的左上角坐标Na(x4,y4),民族栏的长度:w4,民族栏的高度:h4。
...

【技术保护点】

【技术特征摘要】
1.一种WEB端智能检验证照采集的方法,其特征在于,包括以下三个阶段:训练阶段:训练库采集训练样本;服务器利用OCR识别算法和OpenCV识别算法对训练样本进行识别然后存储在所述训练库;训练库对训练样本进行面积占比训练、清晰度训练、证照摆放斜率训练以及进行关键信息有效性的检验,统计训练后的数据,确定评分基准值,根据所述评分基准值确定评分策略,完成训练阶段;采集阶段:用户通过用户端选择或实时拍摄证照,通过web端上传至所述服务器;服务器利用OCR识别算法和OpenCV识别算法对证照进行信息提取并发送至训练库;训练库对证照进行面积占比计算、清晰度计算、证照摆放斜率计算以及进行关键信息有效性的检验,将结果返回至服务器;服务器得出多维度计算值;校验阶段:服务器调取训练库的评分基准值和评分策略对所述多维度计算值进行评分阈值检验,若评分低于阈值则通过web端向用户端提示不通过原因并提示用户端重新操作,若评分不低于阈值则对证照评分进行有效性检测;若有效性检测不通过则通过web端向用户端提示不通过原因并提示用户端重新操作,若有效性检测通过则通过web端向用户端提示证照采集完成。2.根据权利要求1所述一种WEB端智能检验证照采集的方法,其特征在于,面积占比为证件中的头像栏、出生年月栏、性别栏、公民身份证号码栏其中一种的面积或多种的面积与照片面积的比...

【专利技术属性】
技术研发人员:李康明黄松华王蓉黎锦荣郭英有
申请(专利权)人:广东亿迅科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1