一种基于文本识别目标文本的方法、电子设备及存储介质技术

技术编号:35577413 阅读:22 留言:0更新日期:2022-11-12 16:02
本发明专利技术涉及一种基于文本识别目标文本的方法,所述方法包括如下步骤:对目标图像进行处理,获取文本识别区域对应的多边形标注信息;基于多边形的标注信息,进行向内长度为L的缩减,获取第一标签;基于多边形的标注信息,进行向外长度为L的扩张,获取第二标签;基于第一标签和第二标签和目标图像输入图像处理模型,获取最终文本识别区域;基于最终文本识别区域,获取目标字符串;引入预设缩减参数,使得矩形的长宽自适应的缩小,最终获得目标文字。最终获得目标文字。最终获得目标文字。

【技术实现步骤摘要】
一种基于文本识别目标文本的方法、电子设备及存储介质


[0001]本专利技术涉及语义分析领域,特别是涉及一种基于文本识别目标文本的方法、电子设备及存储介质。

技术介绍

[0002]当前,语义分割事当今计算机视觉领域的关键问题之一,从宏观上看,语义分割是一项高层次的任务,为实现场景的完整理解铺平了道路,场景理解作为一个核心的计算机视觉问题,其重要性在于越来越多的应用程序通过从图像中推断知识,其中包括一些自动驾驶、热机交互等,基于语义分割的文字检测在识别过程中,会需要进行缩减,但在缩减过程中,随着文本识别区域长宽比的差异的增多,缩减部分也会增多,会导致文本识别区域区域不能完全覆盖到文字的上下边界。

技术实现思路

[0003]针对上述技术问题,本专利技术采用的技术方案为:一种基于文本识别目标文本的方法,所述方法包括如下步骤:
[0004]S301,对目标图像进行处理,获取文本识别区域对应的多边形标注信息;
[0005]S302,基于多边形的标注信息,对多边形进行向内高度和长度的缩减,获取第一标签,其中,
[0006]L=L1‑
[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H=H1‑
[L1*H1*r/(L1+H1)]*(1

k*L1/H1),其中,H1为多边形标注的矩形的高度、L1为多边形标注的矩形的长度,r是经验系数,H是指缩减后多边形标注的矩形的高度,L是指缩减后多边形标注的矩形的长度,k是指预设缩减参数;r/>[0007]S303,基于多边形的标注信息,对多边形进行向外高度和长度的的扩张,获取第二标签,
[0008]L2=L1+[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H2=H1+[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H2是指扩张后多边形标注的矩形的高度,L2是指扩张后多边形标注的矩形的长度;
[0009]S304,将第一标签、第二标签和目标图像输入图像处理模型,获取最终文本识别区域;
[0010]S305,基于最终文本识别区域进行文字识别,获取目标字符串。
[0011]本专利技术至少具有以下有益效果:
[0012]在缩减过程中引入预设缩减参数,使得在缩减过程中,目标区域的长宽可以适当缩小,避免在缩减过程中,对于长宽比差异较大的矩形,文本区域不能完全覆盖到文字的上下边界,因此引入预设缩减参数,使得矩形的长宽自适应的缩小,最终获得目标文字。
附图说明
[0013]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于
本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1为本专利技术实施例提供的一种获取文本识别区域的数据处理系统的流程图。
[0015]图2为本专利技术实施例提供的一种获取异常文字识别区域的方法的流程图。
[0016]图3为本专利技术实施例提供的一种基于文本识别目标文本的方法的流程图。
具体实施方式
[0017]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0018]实施例1
[0019]一种获取文本识别区域的数据处理系统,其特征在于,所述系统包括摄像装置、数据库,处理器和存储有计算机程序的存储器,所述数据库中存储有指定图像列表A={A1,

,A
i


,A
m
},A
i
是指第i个指定图像,i的取值范围是1到m,m是指定图像的数量,当所述计算机程序被处理器被处理器执行时,实现如下步骤:
[0020]S101,对目标图像进行仿射变换处理,获得目标图像对应的中间图像,目标图像是通过摄像装置获取到的目标文本对应的图像;
[0021]其中,对目标图像进行仿射变换时,基于第一目标点列表C={C1,C2,C3},通过如下步骤获取目标点列表C:
[0022]S1011,获取第一预设定点列表C

={C
′1,

,C

j


,C

n
},C

j
是指第j个第一预设定点,j的取值范围是1到n,n是指第一预设定点的数量,其中,第一类预设定点是指预先指定的点和目标图像的角点;
[0023]S1013,获取C1所在的固定区域D
ζ1
,在D

随机选择一个第一预设定点,标记为C2;其中,C1为随机选择的第一预设定点,D

是指去除固定区域D
ζ1
的第二固定区域列表,D=(D1,

,D
ζ1
,

,D
ζ2


,D
ψ
),D
ζ
是指目标图像中被划分的第ζ个固定区域,ζ的取值范围是1到ψ,ψ是指固定区域的数量;
[0024]S1015,获取C2所在固定区域D
ζ2

[0025]S1017,获取D

对应的第二预设定点列表C

={C
″1,

,C

j1


,C

n1
},C

j1
是指第j1个第二预设定点,j1的取值范围是指1到n1,n1是指第二预设定点的数量,第二预设点是指位于D

的第一预设点;D

是指去除固定区域D
ζ1
和D
ζ2
的第三固定区域列表;
[0026]S1019,遍历C

,获取C

j1
与C1、C2构成第一平面区域列表α

={α
″1,

,α

j1


,α
′′
n1
}并获取第一平面区域列表对应的第一平面区域面积列表S

={S
″1,

,S

j1


,S

n1
},其中,α

j1
是指C

j1
与C1、C2构成本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于文本识别目标文本的方法,其特征在于,所述方法包括如下步骤:S301,对目标图像进行处理,获取文本识别区域对应的多边形标注信息;S302,基于多边形的标注信息,对多边形进行向内高度和长度的缩减,获取第一标签,其中,L=L1‑
[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H=H1‑
[L1*H1*r/(L1+H1)]*(1

k*L1/H1),其中,H1为多边形标注的矩形的高度、L1为多边形标注的矩形的长度,r是经验系数,H是指缩减后多边形标注的矩形的高度,L是指缩减后多边形标注的矩形的长度,k是指预设缩减参数;S303,基于多边形的标注信息,对多边形进行向外高度和长度的的扩张,获取第二标签,L2=L1+[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H2=H1+[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H2是指扩张后多边形标注的矩形的高度,L2是指扩张后多边形标注的矩形的长度;S304,将第一标签、第二标签和目标图像输入图像处理模型,获取最终文本识别区域;S305,基于最终文本识别区域进行文字识别,获取目标字符串。2.根据权利要求1所述的基于文本识别目标文本的方法,其特征在于,r为1.5。3.根据权利要求1所述的基于文本识别目标文本的方法,其特征在于,k为0.05。4.根据权利要求1所述的基于文本识别目标文本的方法,其特征在于,在S305后还包括如下步骤:S3051,获取待处理文本图像对应的目标文本识别区域列表Q={Q1,

,Q
v


,Q
β
}和目标文本识别区域对应的对应的目标文字字符串,Q
v
是指待处理文本图像对应的第v个目标文本识别区域,v的取值范围是1到β,β是指目标文本识...

【专利技术属性】
技术研发人员:石江枫于伟靳雯赵洲洋王全修吴凡
申请(专利权)人:日照睿安信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1