检测任意形状文本的方法技术

技术编号:23239564 阅读:41 留言:0更新日期:2020-02-04 18:45
本发明专利技术公开了一种检测任意形状文本的方法,通过使用特征增强模块能够通过提取全局上下文信息来增大感受野,使得网络能检测很长和很大的文本;此外,特征增强模块还能使网络知道哪些区域属于同一个文本,从而解决了现有方法把具有大的字符间距的文本错误检测为多个文本的问题。其次,通过学习像素间的紧凑性(属于同一个文本实例的像素的关系密切,反之亦然),用X坐标偏移图和Y坐标的偏移图来指导文本分割图,从而重构出更精确的文本边框,从而解决了现有方法将靠得近的两个文本实例错误地检测为一个的问题。最后,本方法能够检测任意形状的文本,解决了现有很多方法只能检测形状规则的文本的问题。

Method of detecting arbitrary shape text

【技术实现步骤摘要】
检测任意形状文本的方法
本专利技术涉及文本检测
,尤其涉及一种检测任意形状文本的方法。
技术介绍
场景文本检测是指从自然场景图像中定位出其中包含的所有文本,是文本识别的前提步骤,在图像检索,场景理解,自动驾驶和文本翻译等领域有很多应用。主流的文本检测方法可以大致分为基于回归和基于分割两类方法。基于回归的文本检测方法对于不规则形状的文本(如曲形文本)的检测效果不佳,检测得到的框包括了大量的背景。基于分割的方法虽然能检测任意形状的文本,但是经常会将靠得很近的两个文本实例检测为一个,并且会将字符间距大的文本实例错误地检测为多个文本。
技术实现思路
本专利技术的目的是提供一种检测任意形状文本的方法,能够检测任意形状的文本,如水平文本、多方向文本以及曲形文本等。此外,还能有效地将两个靠得很近的文本区分开,并且能很好地定位字符间距很大的文本实例。本专利技术的目的是通过以下技术方案实现的:一种检测任意形状文本的方法,其特征在于,包括:通过特征提取网络,提取待检测文本图像的特征,再通过上本文档来自技高网...

【技术保护点】
1.一种检测任意形状文本的方法,其特征在于,包括:/n通过特征提取网络,提取待检测文本图像的特征,再通过上采样与下采样操作获得不同尺度的特征图;其中,特征提取网络中设有特征增强模块,能够提取图像中的全局上下文信息并增大感受野;/n对所有不同尺度的特征图统一进行上采样,并进行级联后通过卷积操作,得到文本与非文本分割图、每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移;/n使用中心感知的聚类算法,利用每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移,指导文本与非文本分割图重建出文本边框。/n

【技术特征摘要】
1.一种检测任意形状文本的方法,其特征在于,包括:
通过特征提取网络,提取待检测文本图像的特征,再通过上采样与下采样操作获得不同尺度的特征图;其中,特征提取网络中设有特征增强模块,能够提取图像中的全局上下文信息并增大感受野;
对所有不同尺度的特征图统一进行上采样,并进行级联后通过卷积操作,得到文本与非文本分割图、每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移;
使用中心感知的聚类算法,利用每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移,指导文本与非文本分割图重建出文本边框。


2.根据权利要求1所述的一种检测任意形状文本的方法,其特征在于,所述通过特征提取网络,提取待检测文本图像的不同尺度的特征,再通过上采样与下采样操作获得不同尺度的特征图包括:
通过设有特征增强模块的特征提取网络提取...

【专利技术属性】
技术研发人员:张勇东周宇谢洪涛李岩
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1