一种纸张字符识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24686163 阅读:25 留言:0更新日期:2020-06-27 08:42
本申请提供了一种纸张字符识别方法、装置、电子设备及存储介质,其中,首先,获取带有待识别字符的纸张的待识别图像。然后,利用图像目标定位模型,在所述待识别图像中确定覆盖所述待识别字符的第一区域图像,并从所述待识别图像中裁剪出所述第一区域图像。之后对所述第一区域图像做去噪声处理,得到去噪图像。最后,利用字符识别模型,识别所述去噪图像中的待识别字符,得到识别结果。可见,本申请所提供的纸张字符识别方法可以通过对带有待识别字符的图像进行去噪处理,以消除图像中的各种噪声对字符识别准确性的影响,从而提高字符识别的准确度。

A paper character recognition method, device, electronic equipment and storage medium

【技术实现步骤摘要】
一种纸张字符识别方法、装置、电子设备及存储介质
本申请涉及图像处理
,尤其涉及一种纸张字符识别方法、装置、电子设备及存储介质。
技术介绍
通常为了在展示文字信息的同时增强阅读的趣味性和观赏性,会在展示文字信息用的纸质文件、图标等上增添背景图案、边框图案等一些花样效果。纸质文件、图标等的载体为纸张,由于纸张天然具有易起皱、易折叠、易脏污等特征,在需要大批量识别纸张上的字符或者纸张上的字符用肉眼难以分辨时,需要利用计算机对纸张进行字符识别。通常会通过拍照或者扫描纸张的方法获得待识别图片,该待识别图片上包含待识别字符,将这些待识别图片上传至计算机上之后,首先利用图片裁剪工具将待识别图片上包含待识别字符的字符区域裁剪下来,以缩小图像识别的范围。然后利用字符识别工具识别裁剪得到的字符区域内的待识别字符。但是,由上文可知,由于纸张本身的性质,待识别图片会区别于理想化图片,存在一些脏污、褶皱、歪曲、花纹干扰等噪声,这些噪声会严重影响字符识别的准确性。
技术实现思路
本申请提供了一种纸张字符识别方法,以提高字符识别的准确性。第一方面,本申请提供了一种纸张字符识别方法,所述方法包括:获取带有待识别字符的纸张的待识别图像;利用图像目标定位模型,在所述待识别图像中确定覆盖所述待识别字符的第一区域图像;从所述待识别图像中裁剪出所述第一区域图像;对所述第一区域图像做去噪声处理,得到去噪图像;利用字符识别模型,识别所述去噪图像中的待识别字符,得到识别结果。在本专利技术实施例第一方面一种可能的实现方式中,所述对第一区域图像做去噪声处理,得到去噪图像包括:利用角度回归模型计算所述待识别字符在所述第一区域图像中的倾斜角度,所述倾斜角度为所述待识别字符所在直线与水平方向的夹角;将所述第一区域图像旋转与所述倾斜角度相等的角度,以使所述待识别字符所在直线与水平方向重合,得到校正后图像;利用边框回归模型对所述校正后图像做边框回归处理,确定第二区域图像,所述第二区域图像为覆盖全部所述待识别字符的最小矩形区域;从所述第一区域图像中裁剪出所述第二区域图像;对所述第二区域图像做去噪声处理,得到去噪图像。在本专利技术实施例第一方面一种可能的实现方式中,所述对第二区域图像做去噪声处理,得到去噪图像包括:对所述第二区域图像做二值化处理,以使所述第二区域图像中的各个像素点的像素值转化为0或255,得到二值化图像;对所述二值化图像做去噪声处理,得到去噪图像。在本专利技术实施例第一方面一种可能的实现方式中,所述对二值化图像做去噪声处理,得到去噪图像包括:确定所述二值化图像中的第一问题像素点,所述问题像素点为像素值连续相等的数量小于预设数量阈值的像素点;从所述二值化图像中剔除所述第一问题像素点,得到去噪图像。在本专利技术实施例第一方面一种可能的实现方式中,所述对二值化图像做去噪声处理了,得到去噪图像包括:确定所述二值化图像中的第二问题像素点,所述第二问题像素点为像素值连续相等的数量大于或者等于预设数量阈值,且所述第二问题像素点所形成的像素区域的宽度小于预设宽度阈值;对所述第二问题像素点所形成的像素区域做膨胀处理,以使所述二值化图像中的所述像素区域的宽度大于或者等于预设宽度阈值,得到去噪图像。在本专利技术实施例第一方面一种可能的实现方式中,所述利用字符识别模型,识别所述去噪图像中的待识别字符,得到识别结果包括:按照预设分割标识,将所述去噪图像分割为多个子区域图像,每一所述子区域图像包含至少一个待识别字符;利用字符识别模型依次识别每一所述子区域图像中的待识别字符,得到子识别结果;按照所述待识别字符在所述待识别图像中的位置顺序,连接各所述子识别结果,得到识别结果。第二方面,本申请提供了一种纸张字符识别装置,所述装置包括:待识别图像获取单元,用于获取带有待识别字符的纸张的待识别图像;第一区域图像确定单元,用于利用图像目标定位模型,在所述待识别图像中确定覆盖所述待识别字符的第一区域图像;第一裁剪单元,用于从所述待识别图像中裁剪出所述第一区域图像;去噪单元,用于对所述第一区域图像做去噪声处理,得到去噪图像;识别单元,用于利用字符识别模型,识别所述去噪图像中的待识别字符,得到识别结果。在本专利技术实施例第二方面一种可能的实现方式中,所述去噪单元包括:角度计算单元,用于利用角度回归模型计算所述待识别字符在所述第一区域图像中的倾斜角度,所述倾斜角度为所述待识别字符所在直线与水平方向的夹角;校正单元,用于将所述第一区域图像旋转与所述倾斜角度相等的角度,以使所述待识别字符所在直线与水平方向重合,得到校正后图像;第二区域图像确定单元,用于利用边框回归模型对所述校正后图像做边框回归处理,确定第二区域图像,所述第二区域图像为覆盖全部所述待识别字符的最小矩形区域;第二裁剪单元,用于从所述第一区域图像中裁剪出所述第二区域图像;第一去噪子单元,用于对所述第二区域图像做去噪声处理,得到去噪图像。在本专利技术实施例第二方面一种可能的实现方式中,所述第一去噪子单元包括:二值化单元,用于对所述第二区域图像做二值化处理,以使所述第二区域图像中的各个像素点的像素值转化为0或255,得到二值化图像;第二去噪子单元,用于对所述二值化图像做去噪声处理,得到去噪图像。在本专利技术实施例第二方面一种可能的实现方式中,所述第二去噪子单元包括:第一问题像素点确定单元,用于确定所述二值化图像中的第一问题像素点,所述问题像素点为像素值连续相等的数量小于预设数量阈值的像素点;第三去噪子单元,用于从所述二值化图像中剔除所述第一问题像素点,得到去噪图像。在本专利技术实施例第二方面一种可能的实现方式中,所述第二去噪子单元包括:第二问题像素点确定单元,用于确定所述二值化图像中的第二问题像素点,所述第二问题像素点为像素值连续相等的数量大于或者等于预设数量阈值,且所述第二问题像素点所形成的像素区域的宽度小于预设宽度阈值;第四去噪子单元,用于对所述第二问题像素点所形成的像素区域做膨胀处理,以使所述二值化图像中的所述像素区域的宽度大于或者等于预设宽度阈值,得到去噪图像。在本专利技术实施例第二方面一种可能的实现方式中,所述识别单元包括:分割单元,用于按照预设分割标识,将所述去噪图像分割为多个子区域图像,每一所述子区域图像包含至少一个待识别字符;子识别单元,用于利用字符识别模型依次识别每一所述子区域图像中的待识别字符,得到子识别结果;结果连接单元,用于按照所述待识别字符在所述待识别图像中的位置顺序,连接各所述子识别结果,得到识别结果。第三方面,本专利技术实施例提供了一种电子设备,包括:处理器,以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执本文档来自技高网...

【技术保护点】
1.一种纸张字符识别方法,其特征在于,所述方法包括:/n获取带有待识别字符的纸张的待识别图像;/n利用图像目标定位模型,在所述待识别图像中确定覆盖所述待识别字符的第一区域图像;/n从所述待识别图像中裁剪出所述第一区域图像;/n对所述第一区域图像做去噪声处理,得到去噪图像;/n利用字符识别模型,识别所述去噪图像中的待识别字符,得到识别结果。/n

【技术特征摘要】
1.一种纸张字符识别方法,其特征在于,所述方法包括:
获取带有待识别字符的纸张的待识别图像;
利用图像目标定位模型,在所述待识别图像中确定覆盖所述待识别字符的第一区域图像;
从所述待识别图像中裁剪出所述第一区域图像;
对所述第一区域图像做去噪声处理,得到去噪图像;
利用字符识别模型,识别所述去噪图像中的待识别字符,得到识别结果。


2.根据权利要求1所述的方法,其特征在于,所述对第一区域图像做去噪声处理,得到去噪图像包括:
利用角度回归模型计算所述待识别字符在所述第一区域图像中的倾斜角度,所述倾斜角度为所述待识别字符所在直线与水平方向的夹角;
将所述第一区域图像旋转与所述倾斜角度相等的角度,以使所述待识别字符所在直线与水平方向重合,得到校正后图像;
利用边框回归模型对所述校正后图像做边框回归处理,确定第二区域图像,所述第二区域图像为覆盖全部所述待识别字符的最小矩形区域;
从所述第一区域图像中裁剪出所述第二区域图像;
对所述第二区域图像做去噪声处理,得到去噪图像。


3.根据权利要求2所述的方法,其特征在于,所述对第二区域图像做去噪声处理,得到去噪图像包括:
对所述第二区域图像做二值化处理,以使所述第二区域图像中的各个像素点的像素值转化为0或255,得到二值化图像;
对所述二值化图像做去噪声处理,得到去噪图像。


4.根据权利要求3所述的方法,其特征在于,所述对二值化图像做去噪声处理,得到去噪图像包括:
确定所述二值化图像中的第一问题像素点,所述问题像素点为像素值连续相等的数量小于预设数量阈值的像素点;
从所述二值化图像中剔除所述第一问题像素点,得到去噪图像。


5.根据权利要求3所述的方法,其特征在于,所述对二值化图像做去噪声处理了,得到去噪图像包括:
确定所述二值化图像中的第二问题像素点,所述第二问题像素点为像素值连续相等的数量大于或者等于预设数量阈值,且所述第二问题像素点所形成的像素区域的宽度小于预设宽度阈值;
对所述第二问题像素点所形成的像素区域做膨胀处理,以使所述二值化图像中的所述像素区域的宽度大于或者等于预设宽度阈值,得到去噪图像。


6.根据权利要求4或5所述的方法,其特征在于,所述利用字符识别模型,识别所述去噪图像中的待识别字符,得到识别结果包括:
按照预设分割标识,将所述去噪图像分割为多个子区域图像,每一所述子区域图像包含至少一个待识别字符;
利用字符识别模型依次识别每一所述子区域图像中的待识别字符,得到子识别结果;
按照所述待识别字符在所述待识别图像中的位置顺序,连接各所述子识别结果,得到识别结果。


7.一种纸张字符识别装置,其特征在于,所述装置包括:
待识别图像获取单元,用于获取带有待识别字符的纸张的待识别图像;
第一区域图像确定单元,用于利用图像目标定位模型,在所述待识别图像中确定覆盖所述待识别字符的第一区域图像;
第一裁剪单元,用于从所述待识别图像中裁剪出所述第一区域图像...

【专利技术属性】
技术研发人员:段胜业史忠伟
申请(专利权)人:五八有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1