一种字符识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36151347 阅读:63 留言:0更新日期:2022-12-31 19:55
本发明专利技术实施例公开了一种字符识别方法、装置、电子设备和存储介质。其中,所述方法包括:获取待识别图像;识别所述待识别图像,确定所述待识别图像中字符信息,根据所述字符信息,获取文本字符和所述文本字符的版式位置参数;根据所述文本字符的版式位置参数,在可编辑文本格式中设置所述文本字符。在进行待识别图像识别的过程中,利用相关算法的中间数据确定文本字符的边缘位置,无需额外的对文本字符边缘检测位置或额外独立的定位算法,这样,使得识别得到的字符既可以满足用户的编辑需求,又可以满足用户对版式还原的需求,识别效率高且位置确定成本低。置确定成本低。置确定成本低。

【技术实现步骤摘要】
一种字符识别方法、装置、电子设备和存储介质


[0001]本专利技术涉及但不限于文字识别
,尤指一种字符识别方法、装置、电子设备和存储介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)技术(以下简称“OCR技术”)是针对待识别的印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
[0003]利用OCR技术可对单个待识别字符进行识别,也可对批量待识别字符进行识别,得到的字符识别结果将以可编辑的文本格式显示,上述格式虽使得字符由不可编辑状态转换为可编辑状态,但是不能还原待识别字符的版式,导致字符识别结果出现文字跑版的情况。因此,相关技术有待提出可识别待识别字符的版式信息的技术。

技术实现思路

[0004]为了解决上述技术问题,本专利技术实施例提供了一种字符识别方法、装置、电子设备和存储介质,能够在识别待识别字符的同时,识别该待识别字符的版式位置信息,以生成相应的字符识别结果。
[0005]具体地,本专利技术是通过如下技术方案实现的:
[0006]第一方面,提供一种字符识别方法,包括:
[0007]获取待识别图像;
[0008]识别所述待识别图像,确定所述待识别图像中字符信息,根据所述字符信息,获取文本字符和所述文本字符的版式位置参数;
[0009]根据所述文本字符的版式位置参数,在可编辑文本格式中设置所述文本字符。
[0010]可选地,所述识别所述待识别图像,确定所述待识别图像中字符信息,包括:
[0011]对所述待识别图像设置感受野;
[0012]判断所述感受野在所述待识别图像中的字符覆盖范围;
[0013]在判定所述感受野在所述待识别图像中覆盖完整字符的情况下,识别所述感受野覆盖的完整字符的文本字符,及所述文本字符的版式位置参数;
[0014]在判定所述感受野在所述待识别图像中未覆盖完整字符的情况下,将所述感受野沿第一方向移动第一移动步长。
[0015]可选地,在判定所述感受野在所述待识别图像中覆盖完整字符的情况下之后,所述方法还包括:
[0016]判断所述感受野覆盖的完整字符是否包含未被识别字符;
[0017]在判定所述感受野覆盖的完整字符包含未被识别字符的情况下,识别所述感受野覆盖的完整字符中未被识别字符的文本字符,及所述文本字符的版式位置参数;
[0018]在判定所述感受野覆盖的完整字符不包含未被识别字符的情况下,将所述感受野沿第一方向移动第一移动步长。
[0019]可选地,所述在判定所述感受野在所述待识别图像中覆盖完整字符的情况下,识别所述感受野覆盖的完整字符的文本字符,及所述文本字符的版式位置参数,包括:
[0020]确定所述感受野覆盖的完整字符在所述待识别图像中覆盖的像素区域;
[0021]根据所述完整字符对应的像素区域的像素,生成相应的文本字符;
[0022]确定所述文本字符的坐标位置,将所述坐标位置作为所述文本字符的版式位置参数。
[0023]可选地,所述确定所述文本字符的坐标位置,包括:
[0024]确定所述文本字符对应在所述感受野中的一个或多个切片,将所述文本字符对应在所述感受野中的切片确定为所述文本字符的中心区域,按照第一扩展步长,分别向第二方向、第三方向扩展所述中心区域;
[0025]在沿所述第二方向扩展的中心区域的边缘满足预设的边缘搜索终止条件的情况下,停止继续扩展,将当前扩展后的中心区域在第二方向的边缘位置确定为所述文本字符在第二方向的坐标位置;
[0026]在沿所述第三方向扩展的中心区域的边缘满足预设的边缘搜索终止条件的情况下,停止继续扩展,将当前扩展后的中心区域在第三方向的边缘位置确定为所述文本字符在第三方向的坐标位置。
[0027]可选地,所述预设的边缘搜索终止条件,最少包括以下条件之一:
[0028]条件1:当前扩展后的中心区域在对应扩展方向的边缘处像素消失;
[0029]条件2:当前扩展后的中心区域在对应扩展方向的边缘处所属的切片对应的感受野,被识别为覆盖的字符为跳变字符或分割字符;
[0030]条件3:当前扩展后的中心区域在对应扩展方向的边缘处所属的切片对应的感受野,被识别为覆盖的字符为与所述文本字符不同的另一个字符。
[0031]可选地,所述识别所述待识别图像,确定所述待识别图像中字符信息,包括:
[0032]提取所述待识别图像中字符特征,将所述字符特征转换为字符特征序列;
[0033]识别并解码所述字符特征序列,获取对应所述字符特征序列的文本字符;
[0034]计算所述文本字符的坐标位置,将所述坐标位置作为所述文本字符的版式位置参数。
[0035]可选地,所述待识别图像包括:一个字符,或者多个字符,或者整段文本;其中,当所述待识别图像包括整段文本的情况下,所述整段文本包括相邻的多个字符。
[0036]可选地,所述识别所述待识别图像,确定所述待识别图像中字符信息,包括:
[0037]识别所述待识别图像,确定所述待识别图像中整段文本的字符信息;或者,识别所述待识别图像,确定所述待识别图像中预设个数的字符的字符信息;或者,识别所述待识别图像,确定所述待识别图像中预设语言类型的字符的字符信息。
[0038]第二方面,提供一种字符识别装置,包括:
[0039]获取模块,用于获取待识别图像;
[0040]识别模块,用于识别所述待识别图像,确定所述待识别图像中字符信息,根据所述字符信息,获取文本字符和所述文本字符的版式位置参数;
[0041]转换模块,用于根据所述文本字符的版式位置参数,在可编辑文本格式中设置所述文本字符。
[0042]第三方面,提供一种电子设备,包括存储器和处理器,所述存储器中存储有用于进行字符识别的计算机程序,所述处理器被设置为读取并运行所述用于进行字符识别的计算机程序,以执行上述任一项字符识别方法。
[0043]第四方面,提供一种计算机可读存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项字符识别方法。
[0044]本专利技术的实施例提供的技术方案可以包括以下有益效果:
[0045]本专利技术实施例,在进行待识别图像识别的过程中,既能识别得到待识别图像中的待识别字符的文本字符,又能获取该文本字符的版式位置参数,无需额外的对待识别字符边缘检测位置或额外独立的定位算法,这样,使得识别得到的待识别字符既可以满足用户的编辑需求,又可以满足用户对版式还原的需求,识别效率高且位置确定成本低。
[0046]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:获取待识别图像;识别所述待识别图像,确定所述待识别图像中字符信息,根据所述字符信息,获取文本字符和所述文本字符的版式位置参数;根据所述文本字符的版式位置参数,在可编辑文本格式中设置所述文本字符。2.根据权利要求1所述的方法,其特征在于,所述识别所述待识别图像,确定所述待识别图像中字符信息,包括:对所述待识别图像设置感受野;判断所述感受野在所述待识别图像中的字符覆盖范围;在判定所述感受野在所述待识别图像中覆盖完整字符的情况下,识别所述感受野覆盖的完整字符的文本字符,及所述文本字符的版式位置参数;在判定所述感受野在所述待识别图像中未覆盖完整字符的情况下,将所述感受野沿第一方向移动第一移动步长。3.根据权利要求2所述的方法,其特征在于,在判定所述感受野在所述待识别图像中覆盖完整字符的情况下之后,所述方法还包括:判断所述感受野覆盖的完整字符是否包含未被识别字符;在判定所述感受野覆盖的完整字符包含未被识别字符的情况下,识别所述感受野覆盖的完整字符中未被识别字符的文本字符,及所述文本字符的版式位置参数;在判定所述感受野覆盖的完整字符不包含未被识别字符的情况下,将所述感受野沿第一方向移动第一移动步长。4.根据权利要求2所述的方法,其特征在于,所述在判定所述感受野在所述待识别图像中覆盖完整字符的情况下,识别所述感受野覆盖的完整字符的文本字符,及所述文本字符的版式位置参数,包括:确定所述感受野覆盖的完整字符在所述待识别图像中覆盖的像素区域;根据所述完整字符对应的像素区域的像素,生成相应的文本字符;确定所述文本字符的坐标位置,将所述坐标位置作为所述文本字符的版式位置参数。5.根据权利要求4所述的方法,其特征在于,所述确定所述文本字符的坐标位置,包括:确定所述文本字符对应在所述感受野中的一个或多个切片,将所述文本字符对应在所述感受野中的切片确定为所述文本字符的中心区域,按照第一扩展步长,分别向第二方向、第三方向扩展所述中心区域;在沿所述第二方向扩展的中心区域的边缘满足预设的边缘搜索终止条件的情况下,停止继续扩展,将当前扩展后的中心区域在第二方向的边缘位置确定为所述文本字符在第二方向的坐标位置;在沿所述第三方向扩展的中心区域的边缘满足预设的边缘搜索终止条件的情况下,停止继续扩展,将当前扩展后的中心区域在...

【专利技术属性】
技术研发人员:熊龙飞陆瑾利杰
申请(专利权)人:北京金山办公软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1