一种使SynthText数据适用于扫描笔文字检测的裁剪方法技术

技术编号：42628848 阅读：36 留言：0更新日期：2024-09-06 01:30

本发明专利技术提供一种使SynthText数据适用于扫描笔文字检测的裁剪方法，包括：S1.获取图像文字位置，给图像做二值化；S2.利用二值图，对图像进行裁剪；S3.计算裁剪后每个字符相对位置。本方法使得SynthText公开数据集适用于文档检测的情况，无需再后期适用小批量文档检测数据集微调。经过本方法更改后的SynthText数据集更适合对图像高度有要求的实际应用场景。对扫译笔中的字符检测任务适配更好。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于ocr文本检测以及数字图像处理领域，特别涉及一种使synthtext数据适用于扫描笔文字检测的裁剪方法。

技术介绍

1、光学字符识别(ocr)技术被广泛的使用在不同场景下，例如：街景文字识别，文档文字识别等一系列应用。为了定位相关文字的位置，则需要大量的图像检测训练集，synthtext则是一个对文字进行定位的数据，用作训练深度神经网络模型的数据集，包含图像与图像中每个字符。

2、现有的synthtext数据集中图像高度平均800像素，而在扫描笔中每次扫描到图像的高度为120个像素，显然以现有的synthtext图像高度不适用于扫描笔中的文字字符检测任务。而且如果直接对图像按照想要的高度进行切割，会存在切割的边界处于文字中间的情况，不利于字符检测神经网络的训练。

3、换句话说，现有的synthtext数据集是一种在自然场景下合成的文字检测数据集，由于其高度(像素值)在400-1200之间，不适用于扫描文档检测(扫描文档的高度为120)，需要对synthtext数据集进行裁剪。

4、此外，...

【技术保护点】

1.一种使SynthText数据适用于扫描笔文字检测的裁剪方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的一种使SynthText数据适用于扫描笔文字检测的裁剪方法，其特征在于，所述方法适用OCR在文档中的应用。

3.根据权利要求1所述的一种使SynthText数据适用于扫描笔文字检测的裁剪方法，其特征在于，所述方法适用于扫译笔。

【技术特征摘要】

1.一种使synthtext数据适用于扫描笔文字检测的裁剪方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的一种使synthtext数据适用于扫描笔文字检测的裁...

【专利技术属性】
技术研发人员：孙振鹏，
申请(专利权)人：北京君正集成电路股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人