一种基于文本识别目标文本的方法、电子设备及存储介质技术

技术编号:35577413 阅读:35 留言:0更新日期:2022-11-12 16:02
本发明专利技术涉及一种基于文本识别目标文本的方法,所述方法包括如下步骤:对目标图像进行处理,获取文本识别区域对应的多边形标注信息;基于多边形的标注信息,进行向内长度为L的缩减,获取第一标签;基于多边形的标注信息,进行向外长度为L的扩张,获取第二标签;基于第一标签和第二标签和目标图像输入图像处理模型,获取最终文本识别区域;基于最终文本识别区域,获取目标字符串;引入预设缩减参数,使得矩形的长宽自适应的缩小,最终获得目标文字。最终获得目标文字。最终获得目标文字。

【技术实现步骤摘要】
一种基于文本识别目标文本的方法、电子设备及存储介质


[0001]本专利技术涉及语义分析领域,特别是涉及一种基于文本识别目标文本的方法、电子设备及存储介质。

技术介绍

[0002]当前,语义分割事当今计算机视觉领域的关键问题之一,从宏观上看,语义分割是一项高层次的任务,为实现场景的完整理解铺平了道路,场景理解作为一个核心的计算机视觉问题,其重要性在于越来越多的应用程序通过从图像中推断知识,其中包括一些自动驾驶、热机交互等,基于语义分割的文字检测在识别过程中,会需要进行缩减,但在缩减过程中,随着文本识别区域长宽比的差异的增多,缩减部分也会增多,会导致文本识别区域区域不能完全覆盖到文字的上下边界。

技术实现思路

[0003]针对上述技术问题,本专利技术采用的技术方案为:一种基于文本识别目标文本的方法,所述方法包括如下步骤:
[0004]S301,对目标图像进行处理,获取文本识别区域对应的多边形标注信息;
[0005]S302,基于多边形的标注信息,对多边形进行向内高度和长度的缩减,获取第一标签,其中
[000本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本识别目标文本的方法,其特征在于,所述方法包括如下步骤:S301,对目标图像进行处理,获取文本识别区域对应的多边形标注信息;S302,基于多边形的标注信息,对多边形进行向内高度和长度的缩减,获取第一标签,其中,L=L1‑
[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H=H1‑
[L1*H1*r/(L1+H1)]*(1

k*L1/H1),其中,H1为多边形标注的矩形的高度、L1为多边形标注的矩形的长度,r是经验系数,H是指缩减后多边形标注的矩形的高度,L是指缩减后多边形标注的矩形的长度,k是指预设缩减参数;S303,基于多边形的标注信息,对多边形进行向外高度和长度的的扩张,获取第二标签,L2=L1+[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H2=H1+[L1*H1*r/(L1+H1)]*(1

k*L1/H1),H2是指扩张后多边形标注的矩形的高度,L2是指扩张后多边形标注的矩形的长度;S304,将第一标签、第二标签和目标图像输入图像处理模型,获取最终文本识别区域;S305,基于最终文本识别区域进行文字识别,获取目标字符串。2.根据权利要求1所述的基于文本识别目标文本的方法,其特征在于,r为1.5。3.根据权利要求1所述的基于文本识别目标文本的方法,其特征在于,k为0.05。4.根据权利要求1所述的基于文本识别目标文本的方法,其特征在于,在S305后还包括如下步骤:S3051,获取待处理文本图像对应的目标文本识别区域列表Q={Q1,

,Q
v


,Q
β
}和目标文本识别区域对应的对应的目标文字字符串,Q
v
是指待处理文本图像对应的第v个目标文本识别区域,v的取值范围是1到β,β是指目标文本识...

【专利技术属性】
技术研发人员:石江枫于伟靳雯赵洲洋王全修吴凡
申请(专利权)人:日照睿安信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1