OCR数据生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:21478853 阅读:14 留言:0更新日期:2019-06-29 05:05
本发明专利技术涉及OCR数据生成方法、装置、计算机设备及存储介质,该方法包括制作原始数据素材;对原始数据素材进行解析和批量修改,以得到标记图像;对标记图像进行识别以提取出文本区域的位置信息,形成OCR数据。本发明专利技术通过借助Photoshop所提供JavaScript接口,对原始数据素材进行解析和批量修改,形成带有文本区域标注的标注图像,在对标注图像进行文本区域识别,以得到该文本区域的位置信息,由此形成用于训练OCR的OCR数据,自动化完成OCR数据的生成,且生成数据的速度快,且数据调整细节简单,实用性强。

【技术实现步骤摘要】
OCR数据生成方法、装置、计算机设备及存储介质
本专利技术涉及计算机,更具体地说是指OCR数据生成方法、装置、计算机设备及存储介质。
技术介绍
OCR(光学字符识别,OpticalCharacterRecognition)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。OCR技术具有广泛用途,但该技术的实现要大量数据做支撑,数据采集是一大问题。目前对于OCR数据的采集方式有两种,一是人工收集、人工标注,该方法要耗费大量人力物力,且一些隐私相关的数据如票据、证件图片不仅收集困难,使用起来还有法律风险;二是编写图像处理程序生成数据。其中又分为图像处理合成方法和GAN方法,前者要实现拟真的图像有巨大的工作量,开发成本高,后者则需要部分真实数据用做训练,且对数据的细节调整较为麻烦。因此,有必要设计一种方法,实现生成数据的速度快,且数据调整细节简单,实用性强。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供OCR数据生成方法、装置、计算机设备及存储介质。为实现上述目的,本专利技术采用以下技术方案:OCR数据生成方法,包括:制作原始数据素材;对原始数据素材进行解析和批量修改,以得到标记图像;对标记图像进行识别以提取出文本区域的位置信息,形成OCR数据。其进一步技术方案为:所述制作原始数据素材,包括:获取高清空白图片;在高清空白图片插入文本,以形成原始数据素材。其进一步技术方案为:所述对原始数据素材进行解析和批量修改,以得到标记图像,包括:通过用Photoshop对原始数据素材进行图层解析,以得到原始数据素材的图层;在原始数据素材的图层上随机生成文本信息;对保存后的文本信息的位置进行随机调整,以形成初步图像;对初步图像转换成智能对象,以形成第二图像;对第二图像进行皱褶制作,以形成第三图像;对第三图像进行形变处理,以得到第四图像;对第四图像进行背景添加处理,以得到第五图像;保存第五图像;对保存后的第五图像进行文本区域标记和保存,以形成标记图像。其进一步技术方案为:所述对第二图像进行皱褶制作,以形成第三图像,包括:获取空白皱纸图片;将空白皱纸图片缩放到第二图像大小;将缩放后的空白皱纸图片进行去色、模糊以及边缘化处理,以形成待综合图像;将待综合图像与第二图像进行图层融合,以形成第三图像。其进一步技术方案为:所述对标记图像进行识别以提取出文本区域的位置信息,形成OCR数据,包括:获取标记图像的标注信息;根据所述标注信息获取标注信息所对应的色块RGB值,以得到参照RGB值;扫描所述标记图像以获取RGB值与参照RGB值一致的像素点;以所述像素点为中心点进行邻域搜索;判断所述邻域中是否有多个RGB值与参照RGB值一致的像素点;若是,则获取所述邻域中RGB值与参照RGB值一致的像素点的坐标,以形成过渡坐标;对所述过渡坐标取平均值,以形成标记点坐标;根据标记点坐标获取文本区域的位置信息,以形成OCR数据。本专利技术还提供了OCR数据生成装置,包括:素材制作单元,用于制作原始数据素材;标记图像获取单元,用于对原始数据素材进行解析和批量修改,以得到标记图像;OCR数据形成单元,用于对标记图像进行识别以提取出文本区域的位置信息,形成OCR数据。其进一步技术方案为:所述素材制作单元包括:图片获取子单元,用于获取高清空白图片;文本插入子单元,用于在高清空白图片插入文本,以形成原始数据素材。其进一步技术方案为:所述标记图像形成单元包括:图层分析子单元,用于通过用Photoshop对原始数据素材进行图层解析,以得到原始数据素材的图层;文本随机生成子单元,用于原始数据素材的图层上随机生成文本信息;位置调整子单元,用于对保存后的文本信息的位置进行随机调整,以形成初步图像;转换子单元,用于对初步图像转换成智能对象,以形成第二图像;皱褶制作子单元,用于对第二图像进行皱褶制作,以形成第三图像;形变处理子单元,用于对第三图像进行形变处理,以得到第四图像;背景处理子单元,用于对第四图像进行背景添加处理,以得到第五图像;保存子单元,用于保存第五图像;区域标记子单元,用于对保存后的第五图像进行文本区域标记和保存,以形成标记图像。本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。本专利技术与现有技术相比的有益效果是:本专利技术通过借助Photoshop所提供JavaScript接口,对原始数据素材进行解析和批量修改,形成带有文本区域标注的标注图像,在对标注图像进行文本区域识别,以得到该文本区域的位置信息,由此形成用于训练OCR的OCR数据,自动化完成OCR数据的生成,且生成数据的速度快,且数据调整细节简单,实用性强。下面结合附图和具体实施例对本专利技术作进一步描述。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的OCR数据生成方法的流程示意图;图2为本专利技术实施例提供的OCR数据生成方法的子流程示意图;图3为本专利技术实施例提供的原始数据素材的示意图;图4为本专利技术实施例提供的OCR数据生成方法的子流程示意图;图5为本专利技术实施例提供的文本位置随机调整后的票据的示意图;图6为本专利技术实施例提供的OCR数据生成方法的子流程示意图;图7为本专利技术实施例提供的皱褶制作后的票据的示意图;图8为本专利技术实施例提供的形变处理后的票据的示意图;图9为本专利技术实施例提供的背景添加处理后的票据的示意图;图10为本专利技术实施例提供的文本区域标记后的票据的示意图;图11为本专利技术实施例提供的OCR数据生成方法的子流程示意图;图12为本专利技术实施例提供的OCR数据生成装置的示意性框图;图13为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1,图1为本专利技术实施例提供的OCR数据生成方法的示意性流程图。OCR数据生成方法应用于服务器中。该服务器与终端进行数据交互,本文档来自技高网...

【技术保护点】
1.OCR数据生成方法,其特征在于,包括:制作原始数据素材;对原始数据素材进行解析和批量修改,以得到标记图像;对标记图像进行识别以提取出文本区域的位置信息,形成OCR数据。

【技术特征摘要】
1.OCR数据生成方法,其特征在于,包括:制作原始数据素材;对原始数据素材进行解析和批量修改,以得到标记图像;对标记图像进行识别以提取出文本区域的位置信息,形成OCR数据。2.根据权利要求1所述的OCR数据生成方法,其特征在于,所述制作原始数据素材,包括:获取高清空白图片;在高清空白图片插入文本,以形成原始数据素材。3.根据权利要求1所述的OCR数据生成方法,其特征在于,所述对原始数据素材进行解析和批量修改,以得到标记图像,包括:通过用Photoshop对原始数据素材进行图层解析,以得到原始数据素材的图层;在原始数据素材的图层上随机生成文本信息;对保存后的文本信息的位置进行随机调整,以形成初步图像;对初步图像转换成智能对象,以形成第二图像;对第二图像进行皱褶制作,以形成第三图像;对第三图像进行形变处理,以得到第四图像;对第四图像进行背景添加处理,以得到第五图像;保存第五图像;对保存后的第五图像进行文本区域标记和保存,以形成标记图像。4.根据权利要求3所述的OCR数据生成方法,其特征在于,所述对第二图像进行皱褶制作,以形成第三图像,包括:获取空白皱纸图片;将空白皱纸图片缩放到第二图像大小;将缩放后的空白皱纸图片进行去色、模糊以及边缘化处理,以形成待综合图像;将待综合图像与第二图像进行图层融合,以形成第三图像。5.根据权利要求1至4任一项所述的OCR数据生成方法,其特征在于,所述对标记图像进行识别以提取出文本区域的位置信息,形成OCR数据,包括:获取标记图像的标注信息;根据所述标注信息获取标注信息所对应的色块RGB值,以得到参照RGB值;扫描所述标记图像以获取RGB值与参照RGB值一致的像素点;以所述像素点为中心点进行邻域搜索;判断所述邻域中是否有多个RGB值与参照RGB值一致的像素点;若是,则获取所述邻域中R...

【专利技术属性】
技术研发人员:张欢李爱林周先得
申请(专利权)人:深圳市华付信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1