图像处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：23213612 阅读：29 留言：0更新日期：2020-01-31 22:10

本申请实施例提供了一种图像处理方法、装置、电子设备及可读存储介质，旨在降低文字识别结果的错误率。所述方法包括：对待处理图像进行目标区域检测，得到所述待处理图像上包含文本图像的目标区域；根据所述包含文本图像的目标区域，对所述待处理图像进行剪裁，得到包含所述文本图像的子图像；对所述子图像中的所述文本图像进行角点预测，得到所述文本图像的角点位置信息；根据所述文本图像的角点位置信息，确定针对所述文本图像的矫正参数，并根据所述矫正参数对所述文本图像进行投影矫正，获得投影矫正后的目标文本图像；对所述目标文本图像进行文字识别，获得该本文图像中的文字信息。

Image processing method, device, electronic equipment and readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、装置、电子设备及可读存储介质
本申请实施例涉及数据处理
，尤其涉及一种图像处理方法、装置、电子设备及可读存储介质。
技术介绍
随着数据处理领域中图像处理技术的发展，越来越多的用户或企业开始借助图像处理技术对图像中的文字进行识别，旨在获得图像中的文字信息。以电商业务为例，商户将营业执照照片和身份证照片上传电商平台后，电商平台为了快速录入营业执照和身份证中的文字信息，通常借助现有的图像处理技术，对商户上传的照片进行文字识别，然后对识别出的文字信息进行人工核对和修正，最后将核对和修改后的文字信息保存，从而完成对营业执照和身份证中文字信息的录入。目前的图像处理技术在进行文字识别时，识别结果的错误率较高，为了更正错位结果，需要投入较大的人力对识别结果进行审核和修正。这不仅导致信息录入效率低，还增加了信息录入成本，因此目前的图像处理技术的实用性较低。
技术实现思路
本申请实施例提供一种图像处理方法、装置、电子设备及可读存储介质，旨在降低文字识别结果的错误率。本申请实施例第一方面提供...

【技术保护点】
1.一种图像处理方法，其特征在于，包括：/n对待处理图像进行目标区域检测，得到所述待处理图像上包含文本图像的目标区域；/n根据所述包含文本图像的目标区域，对所述待处理图像进行剪裁，得到包含所述文本图像的子图像；/n对所述子图像中的所述文本图像进行角点预测，得到所述文本图像的角点位置信息；/n根据所述文本图像的角点位置信息，确定针对所述文本图像的矫正参数，并根据所述矫正参数对所述文本图像进行投影矫正，获得投影矫正后的目标文本图像；/n对所述目标文本图像进行文字识别，获得该本文图像中的文字信息。/n

【技术特征摘要】
1.一种图像处理方法，其特征在于，包括：
对待处理图像进行目标区域检测，得到所述待处理图像上包含文本图像的目标区域；
根据所述包含文本图像的目标区域，对所述待处理图像进行剪裁，得到包含所述文本图像的子图像；
对所述子图像中的所述文本图像进行角点预测，得到所述文本图像的角点位置信息；
根据所述文本图像的角点位置信息，确定针对所述文本图像的矫正参数，并根据所述矫正参数对所述文本图像进行投影矫正，获得投影矫正后的目标文本图像；
对所述目标文本图像进行文字识别，获得该本文图像中的文字信息。

2.根据权利要求1所述的方法，根据所述包含文本图像的目标区域，对所述待处理图像进行剪裁，得到包含所述文本图像的子图像，包括：
对所述目标区域进行扩展，得到扩展后的目标区域；
以所述扩展后的目标区域为剪裁区域，对所述待处理图像进行剪裁，得到包含所述文本图像的子图像。

3.根据权利要求1所述的方法，其特征在于，对所述子图像中的所述文本图像进行角点预测，得到所述文本图像的角点位置信息，包括：
记录所述子图像的原始宽度和原始高度，并对所述子图像的图像尺寸进行标准化处理，得到标准化子图像，所述标准化子图像中包含标准化文本图像；
将所述标准化子图像输入角点预测模型，得到所述标准化文本图像的角点位置信息；
根据所述标准化文本图像的角点位置信息、以及所述子图像的原始宽度和原始高度，确定所述文本图像的角点位置信息。

4.根据权利要求1所述的方法，其特征在于，根据所述文本图像的角点位置信息，确定针对所述文本图像的矫正参数，包括：
根据所述文本图像的角点位置信息和针对所述文本图像的预设长宽比，确定目标文本图像的目标角点位置信息；
根据所述文本图像的角点位置信息和所述目标文本图像的目标角点位置信息，确定针对所述文本图像的矫正参数。

5.根据权利要求4所述的方法，其特征在于，根据所述文本图像的角点位置信息和针对所述文本图像的预设长宽比，确定目标文本图像的目标角点位置信息，包括：
根据所述文本图像的角点位置信息，确定所述文本图像各条边线的中点位置；
根据所述文本图像各条边的中点位置，确定所述文本图像的各条中线的长度，其中，每条中线是所述文本图像的两条相对边线的中点的连线；
根据各条中线的长度和针对所述文本图像的预设长宽比，确定目标文本图像的各条目标中线的长度；
根据所述各条目标中线的长度，确定所述目标文本图像的目标角点位置信息。

6.根据权利要求1至5任一所述的方法，其特征在于，在根据所述矫正参数对所述文本图像进行投影矫正之前，所述方法还包括：
根据所述文本图像的角点位置信息，确定剪裁边线；
沿所述剪裁边线对所述子图像进行剪裁，以裁掉所述子图像中围绕所述文本图像的干扰区域。

7.根据权利要求6所述的方法，其特征在于，在获得投影矫正后的目标文本图像之后，所述方法还包括：
确定所述目标文本图像是否存在缺失边角；
在所述目标文本图像存在缺失边角的情况下，对所述缺失边角所在区域进行填充，得到轮廓为矩形的目标文本图像。

8.根据权利要求1至5任一所述的方法，其特征在于，对待处理图像进行目标区域检测，得到所述待处理图像上的包含文本图像的目标区域，包括：
将所述待处理图像输入目标检测模型，并将所述目标检测模型输出的区域作为所述待处理图像上的包含文本图像的目标区域。

【专利技术属性】
技术研发人员：李楠，张睿，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人