一种文本校正方法及其系统技术方案

技术编号:26599337 阅读:15 留言:0更新日期:2020-12-04 21:22
本发明专利技术提供了一种文本校正方法及其系统,所述校正方法包括如下步骤:获取文本图像,基于图像检测模型对所述文本图像进行检测以得到所述文本图像的区域边界坐标;通过所述区域边界坐标确定校正后的文本图像尺寸;根据校正后的文本图像尺寸对所述文本图像进行感兴趣区创建、并对圈定的感兴趣区进行切割、融合以实现对所述文本图像的校正。本发明专利技术的文本校正方法能对任意方向文本行和弯曲文本进行较好校正,从而提升后续基于字符分割和基于序列识别的文本识别的准确度。

【技术实现步骤摘要】
一种文本校正方法及其系统
本专利技术涉及OCR检测、识别
,具体而言,涉及一种文本校正方法及其系统。
技术介绍
OCR是计算机视觉的重要组成部分之一,它能够检测、识别图片中的文本信息并将其转换成计算机文字,目前已被广泛应用于各种企业级和消费级应用场景中,大大提升企业效率。然而丰富的场景文本行和手机用户拍摄文字图片的文本行中,除水平文本行布局以外还有倾斜和弯曲样式,非直线文本行会给传统基于字符分割算法和基于序列识别的深度学习算法带来困难,导致识别错误。目前关于倾斜文本校正的研究通常包括倾斜角检测和图像旋转两个部分,其核心在于文本倾斜角度的检测,当前常用的倾斜角检测方法有:基于直线拟合方法、基于投影直方图方法和基于Hough变换方法。黄红燕等(浙江大学,2006)提出了一种用连通区域找文字图像特征点为基础的倾斜校正算法,并且给出了在GIS电子地图和OCR文字图像中的实际应用。蒋治华等(中国科学技术大学,2006)针对依赖于车牌边缘存在的传统车牌倾斜校正方法,提出了一种基于车牌字符中心走势线特征的水平倾斜校正方法和一种基于窄孔透视思想的垂直倾斜校正方法,直接对二值车牌图像进行处理,在车牌边缘不存在和字符缺损的情况下依然能够得到理想的倾斜校正效果。王逸芳等(河南工业大学,2010)采用水平投影与离散Wigner-Ville分布结合的方法进行笔迹文档整体和局部倾斜校正,针对手写笔迹图像中存在的倾斜角不一致问题,能够准确完成文本行倾斜角的检测和校正。黄新等(东华大学,2011)针对传统的倾斜校正对不同类型的字符图像处理效果各异的问题,提出了一种改进的算法,加入了新的倾斜角度确定准则、阈值动态调整以及区域后处理,不仅解决了传统方法易受噪声和复杂背景干扰、可操作性差的问题,而且也有效地实现了字符图像的倾斜校正。王楠楠等(杭州电子科技大学,2014)使用了基于Hough变换的倾斜校正算法对倾斜车牌进行校正。除以上传统方法外,深度学习方法在文字倾斜校正领域也得到了应用,M.Jaderberg等(GoogleDeepMind,2015)最早提出了STN网络模型,STN分为LocalizationNetwork、GridGenerator、Sampler三个模块,可以显式的学习得到图像的空间变换参数对图像进行校正。XinyuZhou等(旷世科技,2017)提出了EAST网络模型用于文字检测,其能够检测任意倾斜角度的文本,再通过后处理实现倾斜文本行的水平校正。上述文献和方法主要基于仿射变换思想针对倾斜文本进行校正,而单一的仿射变换方法无法应用于弯曲文本的校正,因此如何能够对任意方向倾斜文本行包括弯曲文本行都得到较好的校正效果是提升后续OCR识别准确率的关键。有鉴于此,特提出本专利技术。
技术实现思路
有鉴于此,本专利技术公开了一种文本校正方法,以及用于实现上述文本校正方法的校正系统,以实现对各种倾斜以及弯曲的文本行都能进行较好的校正,进而提升后续OCR识别的准确率。具体地,本专利技术是通过以下技术方案实现的:第一方面,本专利技术公开了一种文本校正方法,所述方法包括:获取文本图像,基于图像检测模型对所述文本图像进行检测以得到所述文本图像的区域边界坐标;通过所述区域边界坐标确定校正后的文本图像尺寸;根据校正后的文本图像尺寸对所述文本图像进行感兴趣区创建、并对圈定的感兴趣区进行切割、融合以实现对所述文本图像的校正。第二方面,本专利技术公开了一种文本校正系统,包括:检测模块:用于获取文本图像,基于图像检测模型对所述文本图像进行检测以得到所述文本图像的区域边界坐标;尺寸确定模块:用于通过所述区域边界坐标确定校正后的文本图像尺寸;校正模块:用于根据校正后的文本图像尺寸对所述文本图像进行感兴趣区创建、并对圈定的感兴趣区进行切割、融合以实现对所述文本图像的校正。第三方面,本专利技术公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述文本校正方法的步骤。第四方面,本专利技术公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述文本校正方法的步骤。本专利技术实施例提供的一种文本校正方法及其系统,通过采用深度学习的方法训练一个轻量化的图像检测模型,再通过检测模型预测文本的文本线,获取文本感兴趣区域的区域边界坐标,并对所获取的感兴趣区进行循环切割、合并,从而实现倾斜和弯曲文本行的校正。该方法能够避免密集文本粘连,不仅可以对任意倾斜方向文本行进行校正,亦能对弯曲文本行进行水平校正。应用面比较广泛,提高了校正的精准度。避免了以往采用单一的仿射变换方法无法实现对弯曲文本的校正,本专利技术拓宽了文本校正的
,提供了一种文本校正的新方法,该方法可以实现对任何弯曲文本较好的校正,实际应用效果佳。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本专利技术实施例提供的文本校正方法的流程示意图;图2为本专利技术另一种实施例提供的文本校正方法的流程示意图;图3为本专利技术图像检测模型确定的具体操作示意图;图4为本专利技术实施例提供的文本校正的具体操作示意图;图5为本专利技术实施例提供的校正系统的结构示意图;图6为本专利技术实施例提供的一种计算机设备的结构示意图;图7为本专利技术实施例提供的文本校正方法的具体实例效果图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。本专利技术公开了一种文本的校正方法,所述方法包括:获取文本图像,基于图像检测模型对所述文本图像进行检测以得到所述文本图像的区域边界坐标;通过所述区域边界坐标确定校正后的文本图像尺寸;本文档来自技高网
...

【技术保护点】
1.一种文本校正方法,其特征在于,包括如下步骤:/n获取文本图像,基于图像检测模型对所述文本图像进行检测以得到所述文本图像的区域边界坐标;/n通过所述区域边界坐标确定校正后的文本图像尺寸;/n根据校正后的文本图像尺寸对所述文本图像进行感兴趣区创建、并对圈定的感兴趣区进行切割、融合以实现对所述文本图像的校正。/n

【技术特征摘要】
1.一种文本校正方法,其特征在于,包括如下步骤:
获取文本图像,基于图像检测模型对所述文本图像进行检测以得到所述文本图像的区域边界坐标;
通过所述区域边界坐标确定校正后的文本图像尺寸;
根据校正后的文本图像尺寸对所述文本图像进行感兴趣区创建、并对圈定的感兴趣区进行切割、融合以实现对所述文本图像的校正。


2.根据权利要求1所述的文本校正方法,其特征在于,所述图像检测模型采用轻量级网络联合特征金字塔网络训练得到,训练过程中的损失函数为文本线分类损失函数与半径损失、正弦角损失、余弦角损失之和;
其中,所述轻量级网络包括多个对应着不同的区间网络模块的子模块;
所述特征金字塔网络包括上一阶段提取的特征图和对应主干网络层组成。


3.根据权利要求2所述的文本校正方法,其特征在于,所述轻量级网络包括C1、C2、C3、C4子模块,分别对应网络结构中的[0,3],[4,6],[7,11],[11,18]的区间网络模块。


4.根据权利要求3所述的文本校正方法,其特征在于,所述特征金字塔网络采用下述方程实现:
P4=C4
Pi=conv3×3(conv1×1[Ci-1;UpSampling×2(Pi-1)]),fori=1,2,3。


5.根据权利要求4所述的文本校正方法,其特征在于,训练过程中,特征金字塔网络阶段后得到的文本图像为原始文本图像分辨率的一半,通过在特征金字塔网络阶段之后,增加上采样层和2个卷积层生成最终的像素级预测结果以得到所述图...

【专利技术属性】
技术研发人员:陈洋刘家俊刘占亮陈鸣姬晴晴
申请(专利权)人:北京一览群智数据科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1