OCR识别结果位置校正方法及相关设备技术

技术编号:30694909 阅读:17 留言:0更新日期:2021-11-06 09:29
本申请实施例属于文档识别技术领域,涉及一种OCR识别结果位置校正方法,包括通过基于OCR技术的识别模型对识别文档进行实体识别,得到识别结果;构建各所述文档实体的方位关系空间;基于所述方位关系空间,提取各所述文档实体的实体表征向量以及方位关系表征向量;将所述实体表征向量和所述方位关系表征向量输入到训练后的方位校正模型中,得到各方位关系空间中文档实体的方位标签序列,并基于所述方位标签序列对各所述文档实体进行位置校正,得到校正结果。采用本方法减少了服务端数据处理量,扩大了应用场景。扩大了应用场景。扩大了应用场景。

【技术实现步骤摘要】
OCR识别结果位置校正方法及相关设备


[0001]本申请涉及OCR文档识别
,特别是涉及一种OCR识别结果位置校正方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着人们对数据价值的日益重视,需要对历史上积累的大量文档进行电子化,然后从中抽取有用的信息,而OCR技术则是信息抽取任务中的重要环节,其识别文字或者符号的准确度对后续任务有着很大影响。
[0003]但是由于输入到OCR系统的文档,例如图片、PDF等的质量往往不高,以及目前算法的普遍缺陷,会导致以下结果:单个字符识别准确率很高,但是对于跨页的文档、表格等数据,识别往往会出现错误的情形,还需要耗费不少精力去校对还原,为了解决这类缺陷,近年来出现了一些改进方法。
[0004]申请号为CN202011264865.0的中国专利技术专利申请公开了一种文本段落结构还原方法,包括对目标图像进行识别,基于识别结果确定目标图像中所有文本框和各文本框的文本框位置,根据各文本框位置对各文本框进行排序,并基于排序结果将各文本框的文本特征输入至预设的深度学习模型进行训练,基于训练的训练结果对各文本框进行合并处理,以获取目标图片对应的所有文本段落。
[0005]但是在实际实施中发现,该方式需要提取遍历的文本框的位置特征、语言特征以及图像特征,再将之作为遍历的文本框的文本特征。由于需要提取大量的特征来训练深度神经网络模型,使得数据处理的量大大增加,限制了该方式的使用场景。

技术实现思路

[0006]基于此,针对上述技术问题,本申请提供一种OCR识别结果位置校正方法、装置、计算机设备及存储介质,以解决现有技术中数据处理量大,导致的使用场景被限制的技术问题。
[0007]一种OCR识别结果位置校正方法,所述方法包括:
[0008]通过基于OCR技术的识别模型对识别文档进行实体识别,得到识别结果,其中,所述识别结果中包括至少一个文档实体;
[0009]构建各所述文档实体的方位关系空间;
[0010]基于所述方位关系空间,提取各所述文档实体的实体表征向量以及方位关系表征向量;
[0011]将所述实体表征向量和所述方位关系表征向量输入到训练后的方位校正模型中,得到各方位关系空间中文档实体的方位标签序列,并基于所述方位标签序列对各所述文档实体进行位置校正,得到校正结果。
[0012]一种OCR识别结果位置校正装置,所述装置包括:
[0013]识别模块,用于通过基于OCR技术的识别模型对识别文档进行实体识别,得到识别
结果,其中,所述识别结果中包括至少一个文档实体;
[0014]构建模块,用于构建各所述文档实体的方位关系空间;
[0015]提取模块,用于基于所述方位关系空间,提取各所述文档实体的实体表征向量以及方位关系表征向量;
[0016]校正模块,用于将所述实体表征向量和所述方位关系表征向量输入到训练后的方位校正模型中,得到各方位关系空间中文档实体的方位标签序列,并基于所述方位标签序列对各所述文档实体进行位置校正,得到校正结果。
[0017]一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述OCR识别结果位置校正方法的步骤。
[0018]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述OCR识别结果位置校正方法的步骤。
[0019]上述OCR识别结果位置校正方法、装置、计算机设备和存储介质,通过对已经通过OCR技术识别得到的文档中的各文档实体进行方位关系空间的构建,提取各个方位关系空间中各实体文档的两个特征,即实体表征向量和方位关系表征向量,然后输入到校正模型中得到各文档实体的方位标签序列,并基于该序列进行文档实体实际位置的校正。本专利技术对OCR中识别容易出现错位的区域进行了更细致的空间位置划分,即方位关系空间的构建,通过序列标注的方式,准确判断OCR识别的结果在空间上的合理性,并进行自动还原,从而减少了现有技术中需要进行大量特征提取,数据处理量过大导致的场景应用不广的问题。
附图说明
[0020]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0021]图1为OCR识别结果位置校正方法的应用环境示意图;
[0022]图2为OCR识别结果位置校正方法的流程示意图;
[0023]图3为图2中步骤204中构建的方位关系空间的示意图;
[0024]图4为方位校正模型的结构示意图;
[0025]图5为OCR识别结果位置校正装置的示意图;
[0026]图6为一个实施例中计算机设备的示意图。
具体实施方式
[0027]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
[0028]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0029]为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]本专利技术实施例提供的OCR识别结果位置校正方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络以及服务端104,网络用于在终端102和服务端104之间提供通信链路介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0031]用户可以使用终端102通过网络与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0032]终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving 本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种OCR识别结果位置校正方法,其特征在于,所述方法包括:通过基于OCR技术的识别模型对识别文档进行实体识别,得到识别结果,其中,所述识别结果中包括至少一个文档实体;构建各所述文档实体的方位关系空间;基于所述方位关系空间,提取各所述文档实体的实体表征向量以及方位关系表征向量;将所述实体表征向量和所述方位关系表征向量输入到训练后的方位校正模型中,得到各方位关系空间中文档实体的方位标签序列,并基于所述方位标签序列对各所述文档实体进行位置校正,得到校正结果。2.根据权利要求1所述的方法,其特征在于,所述构建各所述文档实体的方位关系空间,包括:获取所述识别文档的标准间距;基于所述标准间距,以各所述文档实体为中心实体,确定所述中心实体所在中心区域的邻近实体区域,得到各文档实体对应的方位关系空间,其中,每个所述邻近实体区域中包括至多一个文档实体或至多一个虚拟实体,作为所述方位关系空间的空间实体。3.根据权利要求2所述的方法,其特征在于,所述获取所述识别文档的标准间距,包括:计算所述识别文档的平均行距;将所述平均行距作为所述标准间距。4.根据权利要求3所述的方法,其特征在于,所述基于所述平均间距,以各所述文档实体为中心实体,确定所述中心实体所在中心区域的邻近实体区域,得到各文档实体对应的方位关系空间,包括:以所述平均行距作为各中心实体所在中心区域的区域边长;构建以各中心实体所在中心区域为中心的九宫格区域,作为方位关系空间,其中,每个九宫格区域包括一个中心区域以及与所述中心区域的8个邻近实体区域。5.根据权利要求4所述的方法,其特征在于,所述提取各所述文档实体的实体表征向量以及方位关系表征向量,包括:确定各方位关系空间上空间区域中空间实体的的实体类型;根据所述实体类型调用对应的特征提取算法,以提取得到所述实体表征向量和方位关系表征向量。6.根据权利要求5所述的方法,其特征在于,所述确定各方位关系空间中空间实体的实体类型,根据所述...

【专利技术属性】
技术研发人员:王伟黄勇其于翠翠张黔
申请(专利权)人:润联软件系统深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1