OCR数据生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：21478853 阅读：14 留言：0更新日期：2019-06-29 05:05

本发明专利技术涉及OCR数据生成方法、装置、计算机设备及存储介质，该方法包括制作原始数据素材；对原始数据素材进行解析和批量修改，以得到标记图像；对标记图像进行识别以提取出文本区域的位置信息，形成OCR数据。本发明专利技术通过借助Photoshop所提供JavaScript接口，对原始数据素材进行解析和批量修改，形成带有文本区域标注的标注图像，在对标注图像进行文本区域识别，以得到该文本区域的位置信息，由此形成用于训练OCR的OCR数据，自动化完成OCR数据的生成，且生成数据的速度快，且数据调整细节简单，实用性强。

全部详细技术资料下载

【技术实现步骤摘要】
OCR数据生成方法、装置、计算机设备及存储介质
本专利技术涉及计算机，更具体地说是指OCR数据生成方法、装置、计算机设备及存储介质。
技术介绍
OCR(光学字符识别，OpticalCharacterRecognition)是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。OCR技术具有广泛用途，但该技术的实现要大量数据做支撑，数据采集是一大问题。目前对于OCR数据的采集方式有两种，一是人工收集、人工标注，该方法要耗费大量人力物力，且一些隐私相关的数据如票据、证件图片不仅收集困难，使用起来还有法律风险；二是编写图像处理程序生成数据。其中又分为图像处理合成方法和GAN方法，前者要实现拟真的图像有巨大的工作量，开发成本高，后者则需要部分真实数据用做训练，且对数据的细节调整较为麻烦。因此，有必要设计一种方法，实现生成数据的速度快，且数据调整细节简单，实用性强。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷，提供OCR数据生成方法、装置、计算机设备及存储介质。为实现上述目的，本专利技术采用以下技术方案：OCR数据生成方法，包括：制作原始数据素材；对原始数据素材进行解析和批量修改，以得到标记图像；对标记图像进行识别以提取出文本区域的位置信息，形成OCR数据。其进一步技术方案为：所述制作原始数据素材，包括：获取高清空白图片；在高清空白图片插入文本，以形成原始数据素材。其进一步技术方案为：所述对原始数据素材进行解析和批量修改，以得到标记图像，包括：通过用Photoshop对原始数据素材进行图层解析，以得到原始数据素材的图层；在原始数据素材的图层上随机...

【技术保护点】
1.OCR数据生成方法，其特征在于，包括：制作原始数据素材；对原始数据素材进行解析和批量修改，以得到标记图像；对标记图像进行识别以提取出文本区域的位置信息，形成OCR数据。

【技术特征摘要】
1.OCR数据生成方法，其特征在于，包括：制作原始数据素材；对原始数据素材进行解析和批量修改，以得到标记图像；对标记图像进行识别以提取出文本区域的位置信息，形成OCR数据。2.根据权利要求1所述的OCR数据生成方法，其特征在于，所述制作原始数据素材，包括：获取高清空白图片；在高清空白图片插入文本，以形成原始数据素材。3.根据权利要求1所述的OCR数据生成方法，其特征在于，所述对原始数据素材进行解析和批量修改，以得到标记图像，包括：通过用Photoshop对原始数据素材进行图层解析，以得到原始数据素材的图层；在原始数据素材的图层上随机生成文本信息；对保存后的文本信息的位置进行随机调整，以形成初步图像；对初步图像转换成智能对象，以形成第二图像；对第二图像进行皱褶制作，以形成第三图像；对第三图像进行形变处理，以得到第四图像；对第四图像进行背景添加处理，以得到第五图像；保存第五图像；对保存后的第五图像进行文本区域标记和保存，以形成标记图像。4.根据权利要求3所述的OCR数据生成方法，其特征在于，所述对第二图像进行皱褶制作，以形成第三图像，包括：获取空白皱纸图片；将空白皱纸图片缩放到第二图像大小；将缩放后的空白皱纸图片进行去色、模糊以及边缘化处理，以形成待综合图像；将待综合图像与第二图像进行图层融合，以形成第三图像。5.根据权利要求1至4任一项所述的OCR数据生成方法，其特征在于，所述对标记图像进行识别以提取出文本区域的位置信息，形成OCR数据，包括：获取标记图像的标注信息；根据所述标注信息获取标注信息所对应的色块RGB值，以得到参照RGB值；扫描所述标记图像以获取RGB值与参照RGB值一致的像素点；以所述像素点为中心点进行邻域搜索；判断所述邻域中是否有多个RGB值与参照RGB值一致的像素点；若是，则获取所述邻域中R...

【专利技术属性】
技术研发人员：张欢，李爱林，周先得，
申请(专利权)人：深圳市华付信息技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人