The invention relates to the field of computer image recognition technology, and discloses a form filling and auditing method, device, device and computer storage medium based on OCR recognition technology. By the invention, the whole form filling and auditing process can be automated, the auditing speed can be greatly accelerated, the labor cost can be saved and the human error can be avoided. In addition, it can also conduct in-depth audit on the common audit items such as filling in content, sealing, customer signature and tick, and ensure the accuracy through a variety of technical cross validation. It has the advantages of smart implementation method, fast speed and less resources, which is convenient for practical application and promotion.
【技术实现步骤摘要】
一种基于OCR识别技术的表单填写审核方法、装置、设备以及计算机存储介质
本专利技术属于计算机图像识别
,具体涉及一种基于OCR识别技术的表单填写审核方法、装置、设备以及计算机存储介质。
技术介绍
目前主流的自定义通用OCR识别技术(即OpticalCharacterRecognition,光学字符识别,是指使用诸如扫描仪或数码相机等的电子设备来检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程),主要用于解决任意尺寸文件的固定字段识别。这种方法的主要问题在于仅对于目标区域进行文字识别,并不能解决诸如文件审核类等的绝大多数其他问题。在文件审核类的工作中,以表单填写的审核场景为例,可以但不限于需要审核如下内容:表格中必填项是否填写;勾选框是否勾选;客户是否在指定区域签字/盖章等。目前这些基本审核工作并不能通过单一的文字识别技术来自动实现,即目前业内的相应解决方案是:先通过部分图像识别算法进行文件的分类和简单裁剪,然后主要通过人工审核来进行文件校验或核对,如此明 ...
【技术保护点】
1.一种基于OCR识别技术的表单填写审核方法,其特征在于,包括如下步骤:/nS101.生成标注有定位点和目标审核区域的表单填写模板图像,其中,针对所述目标审核区域记录有对应的审核类型和审核参数,所述审核类型包括必填项类型/和选填项类型,所述审核参数包括文字需求指示位、盖章需求指示位、单选需求指示位、多选需求指示位和/或最多可填字符数目;/nS102.获取待审核的表单填写待审图像;/nS103.基于OCR识别技术,对所述表单填写待审图像进行文字识别,获取图像识别内容;/nS104.通过匹配定位点的方式,对所述表单填写模板图像与所述表单填写待审图像进行图像配准,获取所述表单填写 ...
【技术特征摘要】
1.一种基于OCR识别技术的表单填写审核方法,其特征在于,包括如下步骤:
S101.生成标注有定位点和目标审核区域的表单填写模板图像,其中,针对所述目标审核区域记录有对应的审核类型和审核参数,所述审核类型包括必填项类型/和选填项类型,所述审核参数包括文字需求指示位、盖章需求指示位、单选需求指示位、多选需求指示位和/或最多可填字符数目;
S102.获取待审核的表单填写待审图像;
S103.基于OCR识别技术,对所述表单填写待审图像进行文字识别,获取图像识别内容;
S104.通过匹配定位点的方式,对所述表单填写模板图像与所述表单填写待审图像进行图像配准,获取所述表单填写待审图像的且与所述表单填写模板图像中目标审核区域一一对应的待审核区域;
S105.针对所述待审核区域,获取对应目标审核区域的审核类型和审核参数,并在该审核类型为必填项类型时,若位于所述待审核区域中的图像识别内容与该审核参数相匹配,则审核通过,否则审核不通过;
S106.输出并展示所述表单填写待审图像的审核结果。
2.如权利要求1所述的一种基于OCR识别技术的表单填写审核方法,其特征在于,在所述步骤S103之前,还包括有如下步骤:
S201.采用图像清晰度评价算法计算所述表单填写待审图像的图像清晰度指标,若计算所得的图像清晰度指标低于预设的图像清晰度阈值,则返回执行步骤S102,否则许可执行步骤S103。
3.如权利要求1所述的一种基于OCR识别技术的表单填写审核方法,其特征在于,在所述步骤S103之前,还包括有如下步骤:
S202.对所述表单填写待审图像进行图像清晰度增强处理,其中,所述图像清晰度增强处理的方式包括图片清洗、像素还原和/或降噪处理方式。
4.如权利要求1所述的一种基于OCR识别技术的表单填写审核方法,其特征在于,在所述步骤S104中,对所述表单填写模板图像与所述表单填写待审图像进行图像配准的方式包括变换矩阵方式和透视变换方式。
5.如权利要求1所述的一种基于OCR识别技术的表单填写审核方法,其特征在于,在所述步骤S105中,按照如下方式判断位于所述待审核区域中的图像识别内容是否与审核参数相匹配:
当所述审核参数包括有效的文字需求指示位时,若所述图像识别内容中包含文字类字符,则匹配,否则不匹配;
当所述审核参数包括有效的盖章需求指示位时,若所述图像识别内容中包含有可通过轮廓提取算法得到的盖章图案,则匹配,否则不匹配;
当所述审核参数包括有效的单选需求指示位时,若所述图像识别内容中包含有仅位于一个勾选框中的勾选字符,则匹配,否则不匹配;
当所述审核参数包括有效的多选需求指示位时,若所述图像识别内容中包含有位于至少一个勾选框中的勾选字符,则匹配,否则不匹配;
当所述审核...
【专利技术属性】
技术研发人员:汪明浩,唐天浩,
申请(专利权)人:北京思图场景数据科技服务有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。