文本区域检测方法、装置、存储介质以及计算机设备制造方法及图纸

技术编号:35764114 阅读:25 留言:0更新日期:2022-12-01 13:59
本申请公开了一种文本区域检测方法、装置、存储介质和计算机设备,其中方法包括:获取包含文本的待检测图像,并基于训练得到的特征提取参数获取待检测图像的图像特征,文本所在区域为曲线区域;基于训练得到的卷积层参数对图像特征进行卷积运算,确定文本所在区域的文本中心线;在文本中心线上均匀设置预设数量的样本点,基于文本中心线以及各样本点,确定至少一个文本框;将各文本框组合,得到待检测图像的文本区域。采用本申请,通过获取待检测图像的文本所在区域的文本中心线,然后基于文本中心线获取待检测图像的文本区域,从而基于文本的形状获取文本区域,降低了文本区域内的非文本像素,进而提高了文本区域的检测准确率。进而提高了文本区域的检测准确率。进而提高了文本区域的检测准确率。

【技术实现步骤摘要】
文本区域检测方法、装置、存储介质以及计算机设备


[0001]本申请涉及计算机
,具体而言,涉及一种文本区域检测方法、装置、存储介质和计算机设备。

技术介绍

[0002]现有的文本区域检测方法主要通过人工设置不同尺度和形状的文本参考框,以覆盖待检测图像中的文本区域。由于自然场景下,不同文本区域之间的形状差别往往非常大,如文本区域可以是直线区域以及曲线区域等。现有技术在对曲线区域进行文本区域检测时,覆盖该曲线区域的文本参考框往往会包含大量的非文本像素,导致得到图像噪声极大的文本区域,从而降低了文本区域的检测准确率。

技术实现思路

[0003]本申请提供一种文本区域检测方法、文本检测装置、存储介质以及计算机设备,可以解决如何提高文本区域的检测准确率的技术问题。
[0004]第一方面,本申请实施例提供一种文本区域检测方法,该方法包括:
[0005]获取包含文本的待检测图像,并基于训练得到的特征提取参数获取待检测图像的图像特征,文本所在区域为曲线区域;
[0006]基于训练得到的卷积层参数对图像特征进行卷积运本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本区域检测方法,其特征在于,所述方法包括:获取包含文本的待检测图像,并基于训练得到的特征提取参数获取所述待检测图像的图像特征,所述文本所在区域为曲线区域;基于训练得到的卷积层参数对所述图像特征进行卷积运算,确定所述文本所在区域的文本中心线;在所述文本中心线上均匀设置预设数量的样本点,基于所述文本中心线以及各所述样本点,确定至少一个文本框;将各所述文本框组合,得到所述待检测图像的文本区域。2.根据权利要求1所述的方法,其特征在于,所述基于所述文本中心线以及各所述样本点,确定至少一个文本框,包括:以各所述样本点为切点,获取各所述样本点在所述文本中心线上的切线;获取各所述切线对应的法线;确定相邻的两条所述法线之间的区域内的文本框。3.根据权利要求2所述的方法,其特征在于,所述确定相邻的两条所述法线之间的区域内的文本框,包括:确定任意两条相邻的所述法线之间的区域;基于训练得到的边界参数与各所述区域内的子文本中心线获取各所述区域的四个边界顶点;将各所述区域内的各所述边界顶点依次连接,得到文本框。4.根据权利要求1所述的方法,其特征在于,所述基于训练得到的特征提取参数获取所述待检测图像的图像特征,包括:基于训练得到的特征提取参数获取所述待检测图像的第一图像特征;对所述待检测图像进行下采样,得到下采样图像,并基于训练得到的特征提取参数获取所述下采样图像的第二图像特征;所述基于训练得到的卷积层参数对所述图像特征进行卷积运算,确定所述文本所在区域的文本中心线,包括:基于训练得到的卷积层参数对所述第一图像特征以及所述第二图像特征进行卷积运算,确定所述文本所在区域的文本中心线。5.根据权利要求1所述的方法,其特征在于,所述获取待检测图像,并基于预先得到的特征提取参数获取所述待检测图像的图像特征之前,还包括:获取训练数据,所述训练数据包括训练图像、所述训练图像中的实际文本区域以及实际文本中心线;基于训练前的初始特征提取参数获取所述训练图像的训练图像特征;基于训练前的初始卷积层参数对所述训练图像特征进行卷积运算,确定所述训练图像中的训练文本的训练文本中心线;在所述训练文本中心线上均匀设置所述预设数量的训练样本点;基于训练前的初始边界参数、所述训练样本点、所述训练文本中心线以及所述实际文本区域的边界线,生成训练文本区域;基于所述训练文本区域、所述实际文本区域、所述训练文本中心线以及所述实际文本
中心线,计算损失值;基于所述损失值训练初始特征提取参数、初始卷积层参数以及初始边界参数,得到训练完成的特征提取参数、卷积层参数以及边界参数。6.根据权利要求5所述的方法,其特征在于,所述基于训练前的初始边界参数、所述训练样本点、所述训练文本中心线以及所述实际文本区域的边界线,生成训练文本区域,包括:基于所述训练样本点、所述训练文本中心线以及所述实际文本区域的边界线,获取第一边界顶点;基于训练前的初始边界参数、所述训练样本点以及所述训练文本中心线,获取第二边界顶点;基于所述第一边界顶点对所述第二边界顶点进行优化,得到优化后...

【专利技术属性】
技术研发人员:赵佳鹏
申请(专利权)人:广州视源人工智能创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1