OCR识别方法及其电子设备技术

技术编号:21433108 阅读:27 留言:0更新日期:2019-06-22 12:11
本申请公开一种OCR识别方法,包括步骤:获取业务方数据的待识别图像;将待识别图像输入通用OCR模版识别,得到待识别图像记载的文本信息及其对应的位置信息;其中,通用OCR模板包括检测模型和通用识别模型,通用识别模型通过业务方的各种业务类型的字段图像样本训练得到;将文本信息及其对应位置信息合成结构化识别数据。本申请还提供OCR识别电子设备。本申请的OCR识别方法及其电子设备,能高效快速通过通用OCR模板对待识别对象(例如合同、发票、票据、证件等)的图像进行识别,生成结构化识别数据,完成光学字符到文本信息的识别。本申请中采用的通用OCR模板的训练时间短,适应性强,能适应多种不同的待识别对象,识别准确率高,识别过程整体效率高。

【技术实现步骤摘要】
OCR识别方法及其电子设备
本申请涉及图像识别领域,更具体地,涉及一种OCR识别方法及其电子设备。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)主要通过对载体上显示的光学字符进行识别,生成文本输出。以纸质文件的OCR识别为例,通过采集纸质文件上的印刷体得到的光学字符,对其进行识别,即可得到文本信息等数据。现有技术中的OCR识别方法往往依赖于识别的对象的特点,进行个性化的模版定制,例如针对票据、报纸、教材等识别的对象,甚至针对不同字号、字体的光学字符识别,都需要重新定制相应的光学字符识别模板,才能采用特定的光学字符识别模板的进行识别。现有技术的OCR识别方法中,定制光学字符识别模板的训练数据量很高,训练时间长,定制识别模板的效率低,很难转移到其他识别对象中应用,定制光学字符识别模板容易受字符变化等因素的影响,OCR识别方法应用的定制光学字符识别模板对对象的依赖性强,影响了OCR识别效率。
技术实现思路
鉴于上述问题,本申请提出了一种OCR识别方法及其电子设备,其能够解决训练时间长,定制识别模板的效率低,难以转移到其他识别对象中应用,定制光学字符识别模板容易受字符变化等因素的影响,定制光学字符识别模板对对象的依赖性强,影响了OCR识别效率的至少一种技术缺陷。本申请提供一种OCR识别方法,包括:获取业务方数据的待识别图像;将所述待识别图像输入通用OCR模版进行识别,得到待识别图像上记载的文本信息及其对应的位置信息;其中,所述通用OCR模板包括检测模型和通用识别模型,所述通用识别模型通过业务方的各种业务类型的字段图像样本训练得到;将所述文本信息及其对应的位置信息合成结构化识别数据。在一种实施例中,所述的OCR识别方法还包括:从业务方数据中确定业务方处理的各个业务类型;根据各个业务类型分别获取对应的样本;利用所述样本训练得到通用识别模型。在一种实施例中,所述利用所述样本训练得到通用识别模型的步骤,包括:提取所述样本中训练图像所记载文本信息的文字特征信息;获取文字特征信息对应的训练文本信息,分析文字特征信息与训练文本信息之间的对应关系,得到映射信息;根据所述映射信息构建通用识别模型。在一种实施例中,所述将所述待识别图像输入通用OCR模版进行识别,得到待识别图像上记载的文本信息及其对应的位置信息的步骤之前,还包括:获取预标注字段子图像位置的训练图像;提取所述文本信息的位置特征信息,根据所述位置特征信息构建所述检测模型。在一种实施例中,所述提取所述文本信息的位置特征信息,根据所述位置特征信息构建所述检测模型的步骤,包括:根据文本信息的行高信息对用于训练检测模型的训练图像进行分割,得到训练子图像;将所述训练子图像输入全连接网络模型,通过识别字符数据库中的字符,计算得到在训练子图像的置信度;根据训练子图像的置信度生成文本信息的长度信息;将所述文本信息的行高信息和长度信息生成文本信息的位置特征信息;根据所述位置特征信息构建所述检测模型。在一种实施例中,所述将所述文本信息及其对应的位置信息合成结构化识别数据的步骤之后,所述的OCR识别方法还包括:对所述结构化识别数据进行准确性评估,得到识别准确率;根据识别准确率调整通用OCR模版的模型参数,生成调整后的通用OCR模版。在一种实施例中,所述将所述文本信息及其对应的位置信息合成结构化识别数据的步骤之后,所述的OCR识别方法还包括:验证所述结构化识别数据是否符合验证条件;若是,输出所述结构化识别数据;若否,将所述结构化识别数据中不符合验证条件的文本信息对应的待识别图像,输入调整后的通用OCR模版中进行重新识别。在一种实施例中,将所述待识别图像输入通用OCR模版进行识别,得到待识别图像上记载的文本信息及其对应的位置信息的步骤之后,当通过通用OCR模版得到多段所述文本信息时,所述的OCR识别方法还包括:根据检测模型识别得到多段文本信息在待识别图像上的相对位置,将多段文本信息依序拼合。在一种实施例中,根据检测模型识别得到多段文本信息在待识别图像上的相对位置,将多段文本信息依序拼合的步骤之后,所述的OCR识别方法还包括:根据多段文本信息在图像信息上的相对位置,调整通用OCR模版的检测模型中的定位间距参数。本申请还提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述任一实施例的所述OCR识别方法的步骤。本申请还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述任一实施例的所述OCR识别方法。相对于现有技术,本申请提供的方案——OCR识别方法及其电子设备,通过获取业务方数据的待识别图像;将所述待识别图像输入通用OCR模版进行识别,得到待识别图像上记载的文本信息及其对应的位置信息;其中,所述通用OCR模板包括检测模型和通用识别模型,所述通用识别模型通过业务方的各种业务类型的字段图像样本训练得到;将所述文本信息及其对应的位置信息合成结构化识别数据的技术方案,能够高效快速地通过通用OCR模板对待识别对象(例如是合同、发票、票据、证件等对象)的图像进行识别,生成结构化识别数据,完成光学字符到文本信息之间的识别。本申请中采用的通用OCR模板的训练时间短,适应性强,能够适应多种不同的待识别对象,识别准确率高,整体的效率高。本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出本申请实施例中OCR识别方法的方法流程图;图2示出本申请实施例中所述OCR识别方法识别的发票样本的示意图;图3示出本申请中根据业务类型训练通用识别模型的方法流程示意图;图4示出本申请实施例中构建通用识别模型的方法流程示意图;图5示出本申请根据预标注字段子图像训练检测模型的方法流程示意图;图6示出本申请根据行高信息、长度信息生成检测模型的方法流程示意图图7示出本申请中根据识别准确率调整模型参数的方法流程示意图;图8示出本申请验证结构化识别数据是否符合验证条件的流程示意图;图9示出本申请实施例中OCR识别方法识别的合同样本的示意图;图10示出本申请实施例提供的终端相关的部分结构的框图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。在本申请的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S1、S21等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。下面将结合本申请实施例中的附图,对本申请实施例中本文档来自技高网
...

【技术保护点】
1.一种OCR识别方法,OCR是指光学字符识别,其特征在于,包括:获取业务方数据的待识别图像;将所述待识别图像输入通用OCR模版进行识别,得到待识别图像上记载的文本信息及其对应的位置信息;其中,所述通用OCR模板包括检测模型和通用识别模型,所述通用识别模型通过业务方的各种业务类型的字段图像样本训练得到;将所述文本信息及其对应的位置信息合成结构化识别数据。

【技术特征摘要】
1.一种OCR识别方法,OCR是指光学字符识别,其特征在于,包括:获取业务方数据的待识别图像;将所述待识别图像输入通用OCR模版进行识别,得到待识别图像上记载的文本信息及其对应的位置信息;其中,所述通用OCR模板包括检测模型和通用识别模型,所述通用识别模型通过业务方的各种业务类型的字段图像样本训练得到;将所述文本信息及其对应的位置信息合成结构化识别数据。2.根据权利要求1所述的OCR识别方法,其特征在于,还包括:从业务方数据中确定业务方处理的各个业务类型;根据各个业务类型分别获取对应的样本;利用所述样本训练得到通用识别模型。3.根据权利要求2所述的OCR识别方法,其特征在于,所述利用所述样本训练得到通用识别模型的步骤,包括:提取所述样本中训练图像所记载文本信息的文字特征信息;获取文字特征信息对应的训练文本信息,分析文字特征信息与训练文本信息之间的对应关系,得到映射信息;根据所述映射信息构建通用识别模型。4.根据权利要求1所述的OCR识别方法,其特征在于,所述将所述待识别图像输入通用OCR模版进行识别,得到待识别图像上记载的文本信息及其对应的位置信息的步骤之前,还包括:获取预标注字段子图像位置的训练图像;提取所述文本信息的位置特征信息,根据所述位置特征信息构建所述检测模型。5.根据权利要求4所述的OCR识别方法,其特征在于,所述提取所述文本信息的位置特征信息,根据所述位置特征信息构建所述检测模型的步骤,包括:根据文本信息的行高信息对用于训练检测模型的训练图像进行分割,得到训练子图像;将所述训练子图像输入全连接网络模型,通过识别字符数据库中的字符,计算得到在训练子图像的置...

【专利技术属性】
技术研发人员:许洋刘鹏王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1