一种使SynthText数据适用于扫描笔文字检测的裁剪方法技术

技术编号:42628848 阅读:36 留言:0更新日期:2024-09-06 01:30
本发明专利技术提供一种使SynthText数据适用于扫描笔文字检测的裁剪方法,包括:S1.获取图像文字位置,给图像做二值化;S2.利用二值图,对图像进行裁剪;S3.计算裁剪后每个字符相对位置。本方法使得SynthText公开数据集适用于文档检测的情况,无需再后期适用小批量文档检测数据集微调。经过本方法更改后的SynthText数据集更适合对图像高度有要求的实际应用场景。对扫译笔中的字符检测任务适配更好。

【技术实现步骤摘要】

本专利技术属于ocr文本检测以及数字图像处理领域,特别涉及一种使synthtext数据适用于扫描笔文字检测的裁剪方法。


技术介绍

1、光学字符识别(ocr)技术被广泛的使用在不同场景下,例如:街景文字识别,文档文字识别等一系列应用。为了定位相关文字的位置,则需要大量的图像检测训练集,synthtext则是一个对文字进行定位的数据,用作训练深度神经网络模型的数据集,包含图像与图像中每个字符。

2、现有的synthtext数据集中图像高度平均800像素,而在扫描笔中每次扫描到图像的高度为120个像素,显然以现有的synthtext图像高度不适用于扫描笔中的文字字符检测任务。而且如果直接对图像按照想要的高度进行切割,会存在切割的边界处于文字中间的情况,不利于字符检测神经网络的训练。

3、换句话说,现有的synthtext数据集是一种在自然场景下合成的文字检测数据集,由于其高度(像素值)在400-1200之间,不适用于扫描文档检测(扫描文档的高度为120),需要对synthtext数据集进行裁剪。

4、此外,现有技术中常用技术术本文档来自技高网...

【技术保护点】

1.一种使SynthText数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种使SynthText数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法适用OCR在文档中的应用。

3.根据权利要求1所述的一种使SynthText数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法适用于扫译笔。

【技术特征摘要】

1.一种使synthtext数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种使synthtext数据适用于扫描笔文字检测的裁...

【专利技术属性】
技术研发人员:孙振鹏
申请(专利权)人:北京君正集成电路股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1