图像文档的矫正方法、装置、设备和可读存储介质制造方法及图纸

技术编号：40940389 阅读：15 留言：0更新日期：2024-04-18 14:58

本发明专利技术公开了一种图像文档的矫正方法、装置、设备和可读存储介质，该方法包括：获取多个图像文档；基于第一预设算法对图像文档进行矫正，生成第一图像文档；基于第二预设算法对第一图像文档进行图像增强处理，生成第二图像文档；将第二图像文档输入至初始神经网络模型中进行训练，生成图像文档矫正模型；获取待识别图像文档，通过图像文档矫正模型对待识别图像文档进行识别，得到待识别图像文档的旋转角度；通过旋转角度对待识别图像文档进行矫正，生成目标方向图像文档。本发明专利技术通过图像增强完善图像文档的内容，并基于增强后的图像文档训练神经网络模型，使用训练好的模型对输入的图像进行旋转矫正，提高了图像文档纠正的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机辅助设计领域，具体涉及一种图像文档的矫正方法、装置、设备和可读存储介质。

技术介绍

1、随着ocr(光学字符识别，optical character recognition)技术的快速发展，人们逐渐对图像的品质要求越来越高。由于大多数光学字符识别软件默认输入图像为正向的，如果输入图像旋转角度过大，可能导致软件无法识别文字，因此，图像文档矫正作为预处理中的重要环节，对后续处理步骤的效果有显著影响。

2、现有技术中的图像文档矫正通常是基于傅里叶变换得到图像的频域信息，预测出图像的旋转角度，从而通过该旋转角度对图像文档进行矫正，从而保证ocr软件识别的准确率。然而该方式只能矫正45°以内的旋转误差，且对于图像噪声较为敏感，主要用于轻微旋转、图像噪声小的扫描文档。此外，对于用相机拍摄的单据图像，背景纹理较为复杂，字迹模糊，旋转角度并不固定，该复杂类型的图像文档也难以通过上述矫正方式达到理想的矫正效果，从而降低ocr软件识别的准确率。

3、针对现有技术中基于傅里叶变换矫正图像文档导致矫正效果不佳的技术问...

【技术保护点】

1.一种图像文档的矫正方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于第二预设算法对所述第一图像文档进行图像增强处理，生成第二图像文档，包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述第一目标图像进行添加表格操作，生成第一增强图像，包括：

4.根据权利要求2所述的方法，其特征在于，所述对所述第五目标图像进行贴图操作，生成第五增强图像，包括：

5.根据权利要求2所述的方法，其特征在于，所述对所述第五中间图像进行缩放操作，生成第六增强图像，包括：

6.根据权利要求5所述的方法，其特征在...

【技术特征摘要】

1.一种图像文档的矫正方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于第二预设算法对所述第一图像文档进行图像增强处理，生成第二图像文档，包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述第一目标图像进行添加表格操作，生成第一增强图像，包括：

4.根据权利要求2所述的方法，其特征在于，所述对所述第五目标图像进行贴图操作，生成第五增强图像，包括：

5.根据权利要求2所述的方法，其特征在于，所述对所述第五中间图像进行缩放操作，生成第六增强图像，包括：

6.根据权利要求5所述的方法，其特征在于，所述对所述第六增强图像进行变换通道操...

【专利技术属性】
技术研发人员：李雪靖，姜天昌，孙天翊，
申请(专利权)人：广联达科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人