【技术实现步骤摘要】
检测任意形状文本的方法
本专利技术涉及文本检测
,尤其涉及一种检测任意形状文本的方法。
技术介绍
场景文本检测是指从自然场景图像中定位出其中包含的所有文本,是文本识别的前提步骤,在图像检索,场景理解,自动驾驶和文本翻译等领域有很多应用。主流的文本检测方法可以大致分为基于回归和基于分割两类方法。基于回归的文本检测方法对于不规则形状的文本(如曲形文本)的检测效果不佳,检测得到的框包括了大量的背景。基于分割的方法虽然能检测任意形状的文本,但是经常会将靠得很近的两个文本实例检测为一个,并且会将字符间距大的文本实例错误地检测为多个文本。
技术实现思路
本专利技术的目的是提供一种检测任意形状文本的方法,能够检测任意形状的文本,如水平文本、多方向文本以及曲形文本等。此外,还能有效地将两个靠得很近的文本区分开,并且能很好地定位字符间距很大的文本实例。本专利技术的目的是通过以下技术方案实现的:一种检测任意形状文本的方法,其特征在于,包括:通过特征提取网络,提取待检测文本 ...
【技术保护点】
1.一种检测任意形状文本的方法,其特征在于,包括:/n通过特征提取网络,提取待检测文本图像的特征,再通过上采样与下采样操作获得不同尺度的特征图;其中,特征提取网络中设有特征增强模块,能够提取图像中的全局上下文信息并增大感受野;/n对所有不同尺度的特征图统一进行上采样,并进行级联后通过卷积操作,得到文本与非文本分割图、每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移;/n使用中心感知的聚类算法,利用每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移,指导文本与非文本分割图重建出文本边框。/n
【技术特征摘要】
1.一种检测任意形状文本的方法,其特征在于,包括:
通过特征提取网络,提取待检测文本图像的特征,再通过上采样与下采样操作获得不同尺度的特征图;其中,特征提取网络中设有特征增强模块,能够提取图像中的全局上下文信息并增大感受野;
对所有不同尺度的特征图统一进行上采样,并进行级联后通过卷积操作,得到文本与非文本分割图、每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移;
使用中心感知的聚类算法,利用每个像素到包含它的文本框的中心点的X坐标偏移、以及每个像素到包含它的文本框的中心点的Y坐标偏移,指导文本与非文本分割图重建出文本边框。
2.根据权利要求1所述的一种检测任意形状文本的方法,其特征在于,所述通过特征提取网络,提取待检测文本图像的不同尺度的特征,再通过上采样与下采样操作获得不同尺度的特征图包括:
通过设有特征增强模块的特征提取网络提取...
【专利技术属性】
技术研发人员:张勇东,周宇,谢洪涛,李岩,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。