文本检测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24577524 阅读:32 留言:0更新日期:2020-06-21 00:35
本申请涉及一种文本检测方法、装置、计算机设备和存储介质。所述方法包括:获取待检测图像;利用滑动窗口策略,采用预设的第一尺寸的窗口,得到待检测图像的多个子图像;将各子图像输入预设的文本检测模型,得到各子图像对应的文本条;其中,文本检测模型用于对各子图像的不同尺度的卷积特征进行融合。采用本方法能够对各子图像中的单个字符进行准确地检测,提高了得到的各子图像对应的文本条的准确度。

Text detection method, device, computer equipment and storage medium

【技术实现步骤摘要】
文本检测方法、装置、计算机设备和存储介质
本申请涉及图像处理
,特别是涉及一种文本检测方法、装置、计算机设备和存储介质。
技术介绍
随着深度学习技术的发展,基于深度学习的文本检测方法已广泛地使用在对文本的分析中。传统技术中,基于深度学习的文本检测方法,将待检测图像输入预先训练好的文本检测模型中,能够对待检测图像中比较容易识别的文本进行准确地检测,例如,对银行票据图像进行分析时,将银行票据图像输入预先训练好的文本检测模型中,能够快速地定位出银行票据图像中的日期、金额等文字区域,加快了对银行票据图像的分析效率。然而,传统的文本检测方法对于小目标文本区域的检测,存在检测准确率较低的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够对小目标文本区域进行检测的文本检测方法、装置、计算机设备和存储介质。一种文本检测方法,所述方法包括:获取待检测图像;利用滑动窗口策略,采用预设的第一尺寸的窗口,得到所述待检测图像的多个子图像;将各所述子图像输入预设的文本检测模型,得到各本文档来自技高网...

【技术保护点】
1.一种文本检测方法,其特征在于,所述方法包括:/n获取待检测图像;/n利用滑动窗口策略,采用预设的第一尺寸的窗口,得到所述待检测图像的多个子图像;/n将各所述子图像输入预设的文本检测模型,得到各所述子图像对应的文本条;其中,所述文本检测模型用于对各所述子图像的不同尺度的卷积特征进行融合。/n

【技术特征摘要】
1.一种文本检测方法,其特征在于,所述方法包括:
获取待检测图像;
利用滑动窗口策略,采用预设的第一尺寸的窗口,得到所述待检测图像的多个子图像;
将各所述子图像输入预设的文本检测模型,得到各所述子图像对应的文本条;其中,所述文本检测模型用于对各所述子图像的不同尺度的卷积特征进行融合。


2.根据权利要求1所述的方法,其特征在于,所述预设的第一尺寸为根据所述待检测图像中文本所占的像素确定的尺寸。


3.根据权利要求1所述的方法,其特征在于,所述将各所述子图像输入预设的文本检测模型,得到各所述子图像对应的文本条之后,所述方法还包括:
利用空间变换网络对各所述文本条中的扭曲文本进行旋转校正,得到校正后的文本;
根据所述校正后的文本,生成各所述文本条对应的校正后的文本条。


4.根据权利要求1所述的方法,其特征在于,所述文本检测模型包括特征提取模块、采样模块和特征融合模块,所述将各所述子图像输入预设的文本检测模型,得到各所述子图像对应的文本条,包括:
将各所述子图像输入所述特征提取模块进行特征提取,得到各所述子图像不同尺度下的特征图;
将各所述子图像不同尺度下的特征图输入所述采样模块进行采样处理,得到各所述子图像不同尺度下的采样特征图;
将所述采样特征图输入所述特征融合模块进行特征融合处理,得到各所述子图像对应的文本条。


5.根据权利要求1所述的方法,其特征在于,所述文本检测模型的训练过程包括:
获取样本图像;
利用所述滑动窗口策略,采用预设的第二尺寸的窗口,得到所述样本图像的多个样本子图像;所述预设的第二尺寸为根据所述样本图像中文本所占的像素确定的尺寸;
获取各所述样本子图像的标注文本条;
将各所述样本子图像输入预设的初始文本检测模型,得到各所述样本子图像对应的样本文本条;其中,所述初始文本检测模型用于对各所述...

【专利技术属性】
技术研发人员:周康明胡威
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1