一种字符识别方法及装置制造方法及图纸

技术编号:28422022 阅读:21 留言:0更新日期:2021-05-11 18:29
本申请提供一种字符识别方法及装置,获得用于进行字符识别的待处理图像,对待处理图像中的每个像素点进行处理,得到每个像素点的预测值,像素点的预测值用于指示像素点与待处理图像中字符的关系,根据每个像素点的预测值,确定对应待处理图像中字符的像素点,根据对应待处理图像中字符的像素点的位置信息,识别待处理图像中的字符,实现根据每个像素点与待处理图像中字符的关系来识别待处理图像中的字符,从而将以文本行为单位进行字符识别转换为以字符为单位进行识别,以将对待处理图像中文本行的定位转换为对字符的定位,这样针对存在弯曲文本和不规则文本等难以进行文本行定位的待处理图像来说,进行字符定位即可,降低字符识别难度。

【技术实现步骤摘要】
一种字符识别方法及装置
本申请属于数据处理
,尤其涉及一种字符识别方法及装置。
技术介绍
目前字符识别以文本行为单位进行字符识别,在待处理图像中标注待识别文本框,然后通过文本识别算法对待识别文本框中的各个字符进行识别。但是目前待处理图像中文本所在区域可能是一个不规则区域,针对这种待处理图像难以从待处理图像中标注出待识别文本框,从而提高字符识别难度。
技术实现思路
本申请提供一种字符识别方法及装置。一方面,本申请提供一种字符识别方法,包括:获得用于进行字符识别的待处理图像;对所述待处理图像中的每个像素点进行处理,得到每个像素点的预测值,所述像素点的预测值用于指示所述像素点与所述待处理图像中字符的关系;根据所述每个像素点的预测值,确定对应所述待处理图像中字符的像素点;根据所述对应所述待处理图像中字符的像素点的位置信息,识别所述待处理图像中的字符。可选的,所述根据所述对应所述待处理图像中字符的像素点的位置信息,识别所述待处理图像中的字符包括:根据所述对应所述待处理图像中字符的像素点的位置信息,确定属于同一字符的像素点的位置信息;从所述属于同一字符的像素点中获得属于字符边缘的目标像素点;根据所述目标像素点的位置信息,得到所述待处理图像中字符的位置信息,以识别出所述待处理图像中的字符。可选的,所述根据所述每个像素点的预测值,确定对应所述待处理图像中字符的像素点包括:根据所述每个像素点的预测值和预设分类值,对所述每个像素点进行分类,得到每个像素点的类型,所述像素点的类型用于指示所述像素点是否位于字符区域;确定类型指示位于字符区域的像素点为对应所述待处理图像中字符的像素点。可选的,所述根据所述每个像素点的预测值和预设分类值,对所述每个像素点进行分类,得到每个像素点的类型包括:如果所述像素点的预测值与第一预设分类值匹配,确定所述像素点为第一类型像素点,所述第一类型像素点用于指示所述像素点位于字符边缘区域;如果所述像素点的预测值与第二预设分类值匹配,确定所述像素点为第二类型像素点,所述第二类型像素点用于指示所述像素点位于字符内部区域;如果所述像素点的预测值与第三预设分类值匹配,确定所述像素点为第三类型像素点,所述第三类型像素点用于指示所述像素点位于字符区域之外;其中,所述第一预设分类值小于所述第二预设分类值,但所述第一预设分类值大于所述第三预设分类值。可选的,所述方法还包括:根据所述待处理图像中字符的位置信息,识别所述字符组成的文本在所述待处理图像中的目标形态;根据所述目标形态,对所述待处理图像进行形态标记。可选的,所述根据所述待处理图像中字符的位置信息,识别所述字符组成的文本在所述待处理图像中的目标形态包括:根据所述待处理图像中字符的位置信息,确定所述字符组成的文本的方向和弯曲程度;根据所述文本的方向和弯曲程度,得到所述文本在所述待处理图像中的目标形态。另一方面,本申请提供一种字符识别装置,包括:获得单元,用于获得用于进行字符识别的待处理图像;预测值得到单元,用于对所述待处理图像中的每个像素点进行处理,得到每个像素点的预测值,所述像素点的预测值用于指示所述像素点与所述待处理图像中字符的关系;确定单元,用于根据所述每个像素点的预测值,确定对应所述待处理图像中字符的像素点;识别单元,用于根据所述对应所述待处理图像中字符的像素点的位置信息,识别所述待处理图像中的字符。可选的,所述识别单元,用于根据所述对应所述待处理图像中字符的像素点的位置信息,确定属于同一字符的像素点的位置信息;从所述属于同一字符的像素点中获得属于字符边缘的目标像素点;根据所述目标像素点的位置信息,得到所述待处理图像中字符的位置信息,以识别出所述待处理图像中的字符。可选的,所述确定单元,用于根据所述每个像素点的预测值和预设分类值,对所述每个像素点进行分类,得到每个像素点的类型,所述像素点的类型用于指示所述像素点是否位于字符区域;确定类型指示位于字符区域的像素点为对应所述待处理图像中字符的像素点。可选的,所述识别单元,还用于根据所述待处理图像中字符的位置信息,识别所述字符组成的文本在所述待处理图像中的目标形态;所述装置还包括:标记单元,用于根据所述目标形态,对所述待处理图像进行形态标记。再一方面,本申请提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述字符识别方法。再一方面,本申请提供一种存储介质,所述存储介质中存储有指令,当所述存储介质中的指令执行时实现上述字符识别方法。上述字符识别方法及装置,获得用于进行字符识别的待处理图像,对待处理图像中的每个像素点进行处理,得到每个像素点的预测值,像素点的预测值用于指示像素点与待处理图像中字符的关系,根据每个像素点的预测值,确定对应待处理图像中字符的像素点,根据对应待处理图像中字符的像素点的位置信息,识别待处理图像中的字符,实现根据每个像素点与待处理图像中字符的关系来识别待处理图像中的字符,从而将以文本行为单位进行字符识别转换为以字符为单位进行识别,以将对待处理图像中文本行的定位转换为对字符的定位,这样针对存在弯曲文本和不规则文本等难以进行文本行定位的待处理图像来说,进行字符定位即可,降低字符识别难度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种字符识别方法的流程图;图2是本申请实施例提供的一种待处理图像中字符存在形变的示意图;图3是本申请实施例提供的一种像素点与字符关系的示意图;图4是本申请实施例提供的另一种像素点与字符关系的示意图;图5是本申请实施例提供的另一种字符识别方法的流程图;图6是本申请实施例提供的一种目标形态的示意图;图7是本申请实施例提供的另一种目标形态的示意图;图8是本申请实施例提供的一种预测模型训练过程的示意图;图9是本申请实施例提供的一种字符识别装置的结构示意图;图10是本申请实施例提供的另一种字符识别装置的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。请参见图1,其示出了本申请实施例提供的一种字符识别方法的流程图,可本文档来自技高网...

【技术保护点】
1.一种字符识别方法,包括:/n获得用于进行字符识别的待处理图像;/n对所述待处理图像中的每个像素点进行处理,得到每个像素点的预测值,所述像素点的预测值用于指示所述像素点与所述待处理图像中字符的关系;/n根据所述每个像素点的预测值,确定对应所述待处理图像中字符的像素点;/n根据所述对应所述待处理图像中字符的像素点的位置信息,识别所述待处理图像中的字符。/n

【技术特征摘要】
1.一种字符识别方法,包括:
获得用于进行字符识别的待处理图像;
对所述待处理图像中的每个像素点进行处理,得到每个像素点的预测值,所述像素点的预测值用于指示所述像素点与所述待处理图像中字符的关系;
根据所述每个像素点的预测值,确定对应所述待处理图像中字符的像素点;
根据所述对应所述待处理图像中字符的像素点的位置信息,识别所述待处理图像中的字符。


2.根据权利要求1所述的方法,所述根据所述对应所述待处理图像中字符的像素点的位置信息,识别所述待处理图像中的字符包括:
根据所述对应所述待处理图像中字符的像素点的位置信息,确定属于同一字符的像素点的位置信息;
从所述属于同一字符的像素点中获得属于字符边缘的目标像素点;
根据所述目标像素点的位置信息,得到所述待处理图像中字符的位置信息,以识别出所述待处理图像中的字符。


3.根据权利要求1所述的方法,所述根据所述每个像素点的预测值,确定对应所述待处理图像中字符的像素点包括:
根据所述每个像素点的预测值和预设分类值,对所述每个像素点进行分类,得到每个像素点的类型,所述像素点的类型用于指示所述像素点是否位于字符区域;
确定类型指示位于字符区域的像素点为对应所述待处理图像中字符的像素点。


4.根据权利要求3所述的方法,所述根据所述每个像素点的预测值和预设分类值,对所述每个像素点进行分类,得到每个像素点的类型包括:
如果所述像素点的预测值与第一预设分类值匹配,确定所述像素点为第一类型像素点,所述第一类型像素点用于指示所述像素点位于字符边缘区域;
如果所述像素点的预测值与第二预设分类值匹配,确定所述像素点为第二类型像素点,所述第二类型像素点用于指示所述像素点位于字符内部区域;
如果所述像素点的预测值与第三预设分类值匹配,确定所述像素点为第三类型像素点,所述第三类型像素点用于指示所述像素点位于字符区域之外;
其中,所述第一预设分类值小于所述第二预设分类值,但所述第一预设分类值大于所述第三预设分类值。

...

【专利技术属性】
技术研发人员:孙炼杰高江涛陈建冲
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1