文本图像处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24709187 阅读:27 留言:0更新日期:2020-07-01 00:08
本申请涉及一种基于神经网络的文本图像处理方法、装置、计算机设备和存储介质。所述方法包括:将待处理文本图像输入至预设文本检测模型中,利用预设文本模型对待处理文本图像中的文字进行边缘检测,得到文字的边缘坐标;根据待处理文本图像中各文字的边缘坐标获取各文字对应最小矩形的矩形面积和倾斜角度;基于各文字最小矩形的矩形面积和倾斜角度对各文字进行筛选,得到无异常文字;根据无异常文字的平均倾斜角度将待处理文本图像进行反向旋转,得到文本图像。采用本方法能够提高准确性。

【技术实现步骤摘要】
文本图像处理方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种图像文本方法、装置、计算机设备和存储介质。
技术介绍
文本图像识别是办公自动化的一个重要领域,但在文本图像识别领域,影响识别率有多种因素。其中图像中的文字倾斜是一个比较重要的因素,因此目前大部分文本图像识别应用中,在识别之前都需要进行矫正。传统的文本图像矫正方法有边缘检测、霍夫直线等,但是都具有很大的局限性。例如由于边缘检测需要图像的文字包含连通区域,只是适合完整对象的图像文字检查。而霍夫直线这种检测方法又依赖图像的质量,鲁棒性比较差,很容易受到图像噪声的影响出现误差,从而导致降低了矫正的准确性。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够准确性的文本图像处理方法、装置、计算机设备和存储介质。一种文本图像处理方法,所述方法包括:将待处理文本图像输入至预设文本检测模型中,利用所述预设文本模型对所述待处理文本图像中的文字进行检测,得到文字的边缘坐标;根据所述待处理文本图像中各所述文字的边缘坐标获取本文档来自技高网...

【技术保护点】
1.一种文本图像处理方法,所述方法包括:/n将待处理文本图像输入至预设文本检测模型中,利用所述预设文本模型对所述待处理文本图像中的文字进行检测,得到文字的边缘坐标;/n根据所述待处理文本图像中各所述文字的边缘坐标获取各所述文字对应最小矩形的矩形面积和倾斜角度;/n基于各所述文字最小矩形的矩形面积和倾斜角度对各所述文字进行异常筛选,得到无异常文字;/n根据所述无异常文字的平均倾斜角度将所述待处理文本图像进行反向旋转,得到文本图像。/n

【技术特征摘要】
1.一种文本图像处理方法,所述方法包括:
将待处理文本图像输入至预设文本检测模型中,利用所述预设文本模型对所述待处理文本图像中的文字进行检测,得到文字的边缘坐标;
根据所述待处理文本图像中各所述文字的边缘坐标获取各所述文字对应最小矩形的矩形面积和倾斜角度;
基于各所述文字最小矩形的矩形面积和倾斜角度对各所述文字进行异常筛选,得到无异常文字;
根据所述无异常文字的平均倾斜角度将所述待处理文本图像进行反向旋转,得到文本图像。


2.根据权利要求1所述的方法,其特征在于,所述根据所述待处理文本图像中各所述文字的边缘坐标获取各所述文字对应最小矩形的矩形面积和倾斜角度,包括:
对所述待处理文本图像中各所述文字的边缘坐标进行抽稀,得到抽稀边缘坐标;
连接各所述抽稀边缘坐标,得到坐标多边形;
遍历得到与所述坐标多边形共边的共边外接矩形;
从所述共边外接矩形中确定最小矩形,并获取所述最小矩形的矩形面积和倾斜角度。


3.根据权利要求1或2所述的方法,其特征在于,所述获取所述最小矩形的倾斜角度,包括:
确定基于所述最小矩形的水平倾斜边相邻的顶点坐标;
根据相邻的所述顶点坐标的坐标值计算水平面与所述水平倾斜边的夹角,得到最小矩形的倾斜角度。


4.根据权利要求1所述的方法,其特征在于,所述基于各所述文字最小矩形的矩形面积和倾斜角度对各所述文字进行筛选,得到无异常文字,包括:
根据所述倾斜角度计算各所述文字的平均倾斜角度;
基于所述平均倾斜角度,剔除所述倾斜角度不满足角度要求的文字;
根据各所述文字最小矩形的矩形面积,从满足角度要求的文字中选择预设数量的文字作为无异常文字。


5.根据权利要求4所述的方法,其特征在于,所述基于所述平均倾斜角度,剔除所述倾斜角度不满足角度要求...

【专利技术属性】
技术研发人员:李海同舒艳波
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1