【技术实现步骤摘要】
本专利技术属于ocr文本检测以及数字图像处理领域,特别涉及一种使synthtext数据适用于扫描笔文字检测的裁剪方法。
技术介绍
1、光学字符识别(ocr)技术被广泛的使用在不同场景下,例如:街景文字识别,文档文字识别等一系列应用。为了定位相关文字的位置,则需要大量的图像检测训练集,synthtext则是一个对文字进行定位的数据,用作训练深度神经网络模型的数据集,包含图像与图像中每个字符。
2、现有的synthtext数据集中图像高度平均800像素,而在扫描笔中每次扫描到图像的高度为120个像素,显然以现有的synthtext图像高度不适用于扫描笔中的文字字符检测任务。而且如果直接对图像按照想要的高度进行切割,会存在切割的边界处于文字中间的情况,不利于字符检测神经网络的训练。
3、换句话说,现有的synthtext数据集是一种在自然场景下合成的文字检测数据集,由于其高度(像素值)在400-1200之间,不适用于扫描文档检测(扫描文档的高度为120),需要对synthtext数据集进行裁剪。
4、此外,
...【技术保护点】
1.一种使SynthText数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种使SynthText数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法适用OCR在文档中的应用。
3.根据权利要求1所述的一种使SynthText数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法适用于扫译笔。
【技术特征摘要】
1.一种使synthtext数据适用于扫描笔文字检测的裁剪方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种使synthtext数据适用于扫描笔文字检测的裁...
【专利技术属性】
技术研发人员:孙振鹏,
申请(专利权)人:北京君正集成电路股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。