图像的文本检测方法及装置制造方法及图纸

技术编号:33084180 阅读:24 留言:0更新日期:2022-04-15 10:43
本申请提供了一种图像的文本检测方法、装置、电子设备及计算机可读存储介质;涉及人工智能技术领域和交通领域,方法包括:从包括文本的图像中识别出多个检测框,获取每个检测框的特征图;基于每个检测框的特征图进行掩膜分割处理,得到文本掩膜分割结果;基于每个检测框的特征图进行至少一种方式的文本框预测处理,得到文本框识别结果;基于文本掩膜分割结果和文本框识别结果的交叠率,确定图像中的实际文本框。通过本申请,能够提升图像中文本的文本框的识别准确度。文本框的识别准确度。文本框的识别准确度。

【技术实现步骤摘要】
图像的文本检测方法及装置


[0001]本申请涉及人工智能
和交通领域,尤其涉及一种图像的文本检测方法及装置。

技术介绍

[0002]人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0003]图像中的文本通常存在倾斜、拉伸、尺寸变化等问题,相关技术通常通过前景背景分离或像素级别特征聚类进行文本检测,对于文本框的检测效果不佳。对于如何提升文本框的检测精度,相关技术尚无有效解决方案。

技术实现思路

[0004]本申请实施例提供一种图像的文本检测方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提升图像中文本框的识别准确度。/>[0005]本申本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像的文本检测方法,其特征在于,所述方法包括:从包括文本的图像中识别出多个检测框,获取每个所述检测框的特征图;基于每个所述检测框的特征图进行掩膜分割处理,得到文本掩膜分割结果;基于每个所述检测框的特征图进行至少一种方式的文本框预测处理,得到文本框识别结果;基于所述文本掩膜分割结果和所述文本框识别结果的交叠率,确定所述图像中的实际文本框。2.根据权利要求1所述的方法,其特征在于,所述从包括文本的图像中识别出多个检测框,获取每个所述检测框的特征图,包括:对所述包括文本的图像进行多个层次的下采样,其中,除最后层次之外的每个层次的下采样得到的下采样特征图,用于作为下一层次的下采样的输入;基于所述多个层次中最后层次的下采样特征图进行多个层次的上采样,其中,除最后层次之外的每个层次的上采样得到的上采样特征图,用于与同尺寸的下采样特征图融合作为下一层次的上采样的输入;基于每个层次的上采样特征图进行是否包括文本的二分类及边界框回归,得到包括文本的多个检测框;对每个所述检测框内的上采样特征图进行尺寸统一化处理,得到处理后的每个所述检测框的特征图。3.根据权利要求1所述的方法,其特征在于,所述基于每个所述检测框的特征图进行掩膜分割处理,得到文本掩膜分割结果,包括:基于每个所述检测框的特征图进行多个层次的卷积操作,得到每个所述检测框中的文本掩膜;基于每个所述检测框的特征图与对应的文本掩膜进行分割处理,得到每个所述检测框中的文本图,将每个所述文本图作为文本掩膜分割结果,其中,每个所述文本图包括对应的文本的像素。4.根据权利要求1所述的方法,其特征在于,所述基于每个所述检测框的特征图进行至少一种方式的文本框预测处理,得到文本框识别结果,包括:执行以下至少一种文本框预测方式:从所述文本掩膜分割结果中获取每个所述检测框的特征图对应的文本图,对每个所述文本图进行外接矩形拟合处理,得到每个所述检测框中的矩形文本框,将每个所述矩形文本框作为第一文本框识别结果;基于每个所述检测框的特征图的端点确定对应的偏移点,基于每个所述检测框对应的多个偏移点确定每个检测框中的偏移文本框,将每个所述偏移文本框作为第二文本框识别结果;基于每个所述检测框的特征图确定文本框端点的多个备选坐标分量值,对所述多个备选坐标分量值进行组合得到每个所述检测框的多种备选文本框,基于所述多种备选文本框进行回归处理,得到每个所述检测框中的候选文本框,将每个所述候选文本框作为第三文本框识别结果;对每个所述检测框的特征图进行分类,得到包括文本的检测框,并基于每个所述包括
文本的检测框的特征图进行检测框位置回归处理,得到每个所述检测框中的修正文本框,将每个所述修正文本框作为第四文本框识别结果。5.根据权利要求4所述的方法,其特征在于,所述对每个所述文本图拟合外接矩形,得到每个所述检测框的矩形文本框,包括:确定每个所述检测框的特征图对应的文本图的轮廓线,并对所述轮廓线拟合外接矩形;选取每个所述检测框的特征图对应的最小外接矩形框,作为每个所述检测框对应的矩形文本框。6.根据权利要求4所述的方法,其特征在于,所述基于每个所述检测框的特征图的端点...

【专利技术属性】
技术研发人员:单鼎一
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1