一种基于文本识别目标文本的方法、电子设备及存储介质技术

技术编号：35577413 阅读：35 留言：0更新日期：2022-11-12 16:02

本发明专利技术涉及一种基于文本识别目标文本的方法，所述方法包括如下步骤：对目标图像进行处理，获取文本识别区域对应的多边形标注信息；基于多边形的标注信息，进行向内长度为L的缩减，获取第一标签；基于多边形的标注信息，进行向外长度为L的扩张，获取第二标签；基于第一标签和第二标签和目标图像输入图像处理模型，获取最终文本识别区域；基于最终文本识别区域，获取目标字符串；引入预设缩减参数，使得矩形的长宽自适应的缩小，最终获得目标文字。最终获得目标文字。最终获得目标文字。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本识别目标文本的方法、电子设备及存储介质

[0001]本专利技术涉及语义分析领域，特别是涉及一种基于文本识别目标文本的方法、电子设备及存储介质。

技术介绍

[0002]当前，语义分割事当今计算机视觉领域的关键问题之一，从宏观上看，语义分割是一项高层次的任务，为实现场景的完整理解铺平了道路，场景理解作为一个核心的计算机视觉问题，其重要性在于越来越多的应用程序通过从图像中推断知识，其中包括一些自动驾驶、热机交互等，基于语义分割的文字检测在识别过程中，会需要进行缩减，但在缩减过程中，随着文本识别区域长宽比的差异的增多，缩减部分也会增多，会导致文本识别区域区域不能完全覆盖到文字的上下边界。

技术实现思路

[0003]针对上述技术问题，本专利技术采用的技术方案为：一种基于文本识别目标文本的方法，所述方法包括如下步骤：
[0004]S301，对目标图像进行处理，获取文本识别区域对应的多边形标注信息；
[0005]S302，基于多边形的标注信息，对多边形进行向内高度和长度的缩减，获取第一标签，其中，
[000本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于文本识别目标文本的方法，其特征在于，所述方法包括如下步骤：S301，对目标图像进行处理，获取文本识别区域对应的多边形标注信息；S302，基于多边形的标注信息，对多边形进行向内高度和长度的缩减，获取第一标签，其中，L＝L1‑
[L1*H1*r/(L1+H1)]*(1
‑
k*L1/H1)，H＝H1‑
[L1*H1*r/(L1+H1)]*(1
‑
k*L1/H1)，其中，H1为多边形标注的矩形的高度、L1为多边形标注的矩形的长度，r是经验系数，H是指缩减后多边形标注的矩形的高度，L是指缩减后多边形标注的矩形的长度，k是指预设缩减参数；S303，基于多边形的标注信息，对多边形进行向外高度和长度的的扩张，获取第二标签，L2＝L1+[L1*H1*r/(L1+H1)]*(1
‑
k*L1/H1)，H2＝H1+[L1*H1*r/(L1+H1)]*(1
‑
k*L1/H1)，H2是指扩张后多边形标注的矩形的高度，L2是指扩张后多边形标注的矩形的长度；S304，将第一标签、第二标签和目标图像输入图像处理模型，获取最终文本识别区域；S305，基于最终文本识别区域进行文字识别，获取目标字符串。2.根据权利要求1所述的基于文本识别目标文本的方法，其特征在于，r为1.5。3.根据权利要求1所述的基于文本识别目标文本的方法，其特征在于，k为0.05。4.根据权利要求1所述的基于文本识别目标文本的方法，其特征在于，在S305后还包括如下步骤：S3051，获取待处理文本图像对应的目标文本识别区域列表Q＝{Q1，
…
，Q
v
，
…
，Q
β
}和目标文本识别区域对应的对应的目标文字字符串，Q
v
是指待处理文本图像对应的第v个目标文本识别区域，v的取值范围是1到β，β是指目标文本识...

【专利技术属性】
技术研发人员：石江枫，于伟，靳雯，赵洲洋，王全修，吴凡，
申请(专利权)人：日照睿安信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人