一种文本图像的检测方法、装置、介质及设备制造方法及图纸

技术编号:32363735 阅读:16 留言:0更新日期:2022-02-20 03:34
本申请实施例公开了一种文本图像的检测方法、装置、介质及设备。其中,该方法包括:获取待检测文本图像;利用预先训练的文字检测模型,对所述待检测文本图像进行文字检测,得到文字检测结果;所述文字检测模型包括主干网络、区域检测分支以及文字分割分支;所述区域检测分支和所述文字分割分支均连接在所述主干网络之后。本技术方案,可以通过搭建多分支的文字检测模型,增强文字检测模型的泛化能力,实现准确的区域检测框回归和文字分割,进而有效提升文本图像检测的鲁棒性和准确性,降低检测时间。低检测时间。低检测时间。

【技术实现步骤摘要】
一种文本图像的检测方法、装置、介质及设备


[0001]本申请实施例涉及图像处理
,尤其涉及一种文本图像的检测方法、装置、介质及设备。

技术介绍

[0002]随着深度学习技术的不断发展,文字检测作为光学字符识别技术重要的一环,扮演着十分重要的角色。文字检测具有广泛的应用场景,例如身份证、银行卡、发票以及快递面单等文字检测场景。
[0003]现有技术中,对于文本图像中的文字检测主要是采用目标分割算法对文本图像先进行文字区域定位,然后对文字区域进行文字分割,进而实现文字检测的目的。
[0004]基于文字分割的方法能有效的解决文字方向分布多样性的问题,但是,针对背景复杂、文字模糊等情况现存的文字检测算法容易出现误检、漏检以及检测框出现偏移等问题。

技术实现思路

[0005]本申请实施例提供一种文本图像的检测方法、装置、介质及设备,可以通过搭建多分支的文字检测模型,可以增强文字检测模型的泛化能力,实现准确的区域检测框回归和文字分割。
[0006]第一方面,本申请实施例提供了一种文本图像的检测方法,所述方法包括:
[0007]获取待检测文本图像;
[0008]利用预先训练的文字检测模型,对所述待检测文本图像进行文字检测,得到文字检测结果;所述文字检测模型包括主干网络、区域检测分支以及文字分割分支;所述区域检测分支和所述文字分割分支均连接在所述主干网络之后。
[0009]第二方面,本申请实施例提供了一种文本图像的检测装置,该装置包括:
[0010]待检测文本图像获取模块,用于获取待检测文本图像;
[0011]文字检测结果确定模块,用于利用预先训练的文字检测模型,对所述待检测文本图像进行文字检测,得到文字检测结果;所述文字检测模型包括主干网络、区域检测分支以及文字分割分支;所述区域检测分支和所述文字分割分支均连接在所述主干网络之后。
[0012]第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的文本图像的检测方法。
[0013]第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的文本图像的检测方法。
[0014]本申请实施例所提供的技术方案,通过获取待检测文本图像,利用预先训练的文字检测模型,对待检测文本图像进行文字检测,得到文字检测结果。其中,文字检测模型包括主干网络、区域检测分支以及文字分割分支。区域检测分支和所述文字分割分支均连接
在所述主干网络之后。本方案通过搭建多分支的文字检测模型,可以增强文字检测模型的泛化能力,实现准确的文字区域检测框回归和文字分割,进而有效提升文本图像检测的鲁棒性和准确性,降低检测时间。
附图说明
[0015]图1A是本申请实施例一提供的文本图像的检测方法的流程图;
[0016]图1B是本申请实施例一提供的文字检测模型的结构示意图;
[0017]图2为本专利技术实施例二中的文本图像的检测方法的流程图;
[0018]图3为本专利技术实施例三提供的一种文本图像的检测装置的结构示意图;
[0019]图4是本申请实施例五提供的一种电子设备的结构示意图。
具体实施方式
[0020]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
[0021]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0022]实施例一
[0023]图1A是本申请实施例一提供的文本图像的检测方法的流程图,本实施例可适用于任何文本图像的检测场景,该方法可以由本申请实施例所提供的文本图像的检测装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于电子设备中。
[0024]如图1A所示,所述文本图像的检测方法包括:
[0025]S110,获取待检测文本图像。
[0026]本方案可以由计算机、服务器以及工作站等电子设备执行,在此基础上,所述电子设备还可以配置有图像采集设备。电子设备可以自主获取待检测文本图像。所述文本图像可以是身份证、银行卡、文本截图、发票以及快递面单等图片数据,还可以是监控、电影以及纪录片等视频数据。获取待检测文本图像的方式可以是实时读取图像接收装置采集到的图片数据,例如身份证识别场景。电子设备还可以在检测指令控制下有选择的获取待检测文本图像,例如视频理解和视频搜索等场景。
[0027]在获取到待检测文本图像之后,如果待检测文本图像存在模糊、目标尺寸不适等情况,电子设备可以通过图像增强、图像剪切以及图像放缩等手段对待检测文本图像进行预处理,以提高图像质量。
[0028]S120,利用预先训练的文字检测模型,对所述待检测文本图像进行文字检测,得到文字检测结果;其中,所述文字检测模型包括主干网络、区域检测分支以及文字分割分支;所述区域检测分支和所述文字分割分支均连接在所述主干网络之后。
[0029]利用预先训练的文字检测模型,电子设备可以对待检测文本图像进行文字检测,
并得到检测检测结果。图1B是本申请实施例一提供的文字检测模型的结构示意图,如图1B所示,所述文字检测模型包括主干网络、区域检测分支以及文字分割分支,所述区域检测分支和所述文字分割分支均连接在所述主干网络之后。所述区域检测分支可以用于定位待检测文本图像中文字所在区域,并用规则形状的检测框对文字区域进行标注。所述文字分割分支可以用于对文字区域中的文字进行进一步的分割,确定文字区域中的内边界和外边界。所述文字检测模型可以是深度学习模型,例如可以是卷积神经网络。所述主干网络可以是任何具有特征提取功能的网络结构,例如可以是AlexNet、VGG

Net以及ResNet等经典卷积神经网络结构,也可以是自主搭建的符合场景需求的网络结构。所述区域检测分支可以具有特征提取功能的网络结构,也可以仅具有区域检测功能的结构。同理,所述文字分割分支可以具有特征提取功能的结构,也可以仅具有文字分割功能的结构。如果所述区域检测分支和所述文字分割分支均具有特征提取功能的网络结构,它们的网络结构可以相同也可以不同。
[0030]在本方案中,可选的,所述文字分割分支包括分割共享网络、第一文字分割分支以及第二文字分割分支;所述第一文字分割分支和所述第二文字分割分支均连接在所述分割共享网络之后。
[0031]为实现针对性的文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本图像的检测方法,其特征在于,所述方法包括:获取待检测文本图像;利用预先训练的文字检测模型,对所述待检测文本图像进行文字检测,得到文字检测结果;其中,所述文字检测模型包括主干网络、区域检测分支以及文字分割分支;所述区域检测分支和所述文字分割分支均连接在所述主干网络之后。2.根据权利要求1所述的方法,其特征在于,所述文字分割分支包括分割共享网络、第一文字分割分支以及第二文字分割分支;所述第一文字分割分支和所述第二文字分割分支均连接在所述分割共享网络之后。3.根据权利要求2所述的方法,其特征在于,所述区域检测分支设置有第一损失函数;所述第一文字分割分支设置有第二损失函数;所述第二文字分割分支设置有第三损失函数。4.根据权利要求3所述的方法,其特征在于,所述第一损失函数表达式为:L1=λ1l1;l1=l
A
+l
B
;;其中,L1代表第一损失函数,λ1为预设系数,l
A
表示对文字区域长和宽的回归,l
B
表示对文字区域的回归,x,y表示文本图像的像素点坐标位置,c表示提取特征通道数量,Y
xyc
表示在坐标x,y处存在文字的概率,表示所述文字检测模型预测在坐标x,y处存在文字的概率,α和β为超参数,N代表的是文本图像关键点个数;以及,所述第二损失函数表达式为:L2=λ2l2;其中,L2代表第二损失函数,λ2为预设系数,(i,j)表示特征图的坐标位置,S
l
表示特征图,Y
(i,j)
表示特征图(i,j)位置的文字真实结果,表示特征图(i,j)位置的文字预测结果;以及,所述第三损失函数表达式为:L3=λ3l3;其中,L3代表第二损失函数,λ3为预设系数,P表示文字区域的概率图,T表示文字区域的分割图,γ为超参数;其中,λ1+λ2+λ3=1。5.根据权利要求1所述的方法,其特征在于,所述文字检测模型的训练过程,包括:
获取文本图像训练数据;将所述文本图像训练数据输入至文字检测模型的主干网络,以得到中间特征,并将所述中间特征传递至区域检测分支以及文字分割分支;其中,所述中间特征经过所述...

【专利技术属性】
技术研发人员:朱浩李丽孟彦伟
申请(专利权)人:中邮信息科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1