一种字符识别方法及装置制造方法及图纸

技术编号:20285424 阅读:17 留言:0更新日期:2019-02-10 17:55
本申请实施例提供了一种字符识别方法及装置,涉及信息处理技术领域,其中,上述方法包括:判断图像的字符区域是否为斜体字符区域;对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;对所述待识别字符区域中的字符进行字符识别。应用本申请实施例提供的方案进行字符识别,在使用包含正常字符的样本图像训练的字符识别模型进行字符识别时,能够提高对斜体字符进行字符识别的准确度。

A Character Recognition Method and Device

The embodiment of this application provides a character recognition method and device, which relates to the field of information processing technology. The method includes: judging whether the character area of an image is an italic character area; correcting the character area to reduce the inclination of the character to obtain the character area to be recognized; and recognizing the character in the character area to be recognized. The scheme provided in the embodiment of this application is applied for character recognition, and the accuracy of character recognition for italic characters can be improved when using a character recognition model trained with sample image containing normal characters.

【技术实现步骤摘要】
一种字符识别方法及装置
本申请涉及信息处理
,特别是涉及一种字符识别方法及装置。
技术介绍
在人工智能技术高速发展的今天,基于图像进行字符识别的需求越来越多。在基于图像进行字符识别时,需获取大量样本图像,然后基于这些样本图像训练字符识别模型,并通过训练好的字符识别模型识别图像中的字符。由于实际应用中大多数字符均为正常字符,也就是不具有倾斜度的字符,所以在训练上述字符识别模型时,所采用的样本图像一般为包含正常字符的图像。由于正常字符与斜体字符的特征不同,这样在图像中包含斜体字符的情况下,仍然采用上述字符识别模型进行字符,易导致准确度较低。
技术实现思路
本申请实施例的目的在于提供一种字符识别方法及装置,以在使用包含正常字符的样本图像训练的字符识别模型进行字符识别时,提高对斜体字符进行字符识别的准确度。具体技术方案如下:第一方面,本申请实施例提供了一种字符识别方法,所述方法包括:判断图像的字符区域是否为斜体字符区域;若为是,对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;对所述待识别字符区域中的字符进行字符识别。第二方面,本申请实施例提供了一种字符识别装置,所述装置包括:区域判断模块,用于判断图像的字符区域是否为斜体字符区域,若为是,触发校正处理模块;所述校正处理模块,用于对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;字符识别模块,用于对所述待识别字符区域中的字符进行字符识别。第三方面,本申请实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现本申请实施例所述的字符识别方法步骤。第四方面,本申请实施例提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现本申请实施例所述的字符识别方法步骤。由以上可见,应用本申请实施例提供的方案识别字符时,若图像的字符区域为斜体字符区域,则先对字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域,再对待识别字符区域中的字符进行字符识别。由于对字符区域进行的是减轻字符倾斜程度的校正处理,因此会减轻字符区域中字符的倾斜程度,使得斜体字符被校正为正常字符,从而应用本申请实施例提供的方案、使用包含正常字符的样本图像训练的字符识别模型进行字符识别时,能够提高对斜体字符进行字符识别的准确度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种字符识别方法的流程示意图;图2为本申请实施例提供的第一种字符区域示意图;图3a为本申请实施例提供的第二种字符区域示意图;图3b为本申请实施例提供的第三种字符区域示意图;图3c为本申请实施例提供的一种字符识别结果示意图;图3d为现有技术提供的字符识别结果示意图;图4为本申请实施例提供的一种字符识别装置的结构示意图;图5为本申请实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。由于现有技术中对包含斜体字符的图像进行字符识别时,准确度低,为解决这一技术问题,本申请实施例提供了一种字符识别方法及装置。下面通过具体实施例对本申请实施例提供的字符识别方法进行详细介绍。图1为本申请实施例提供的一种字符识别方法的流程示意图,该方法包括:S101:判断图像的字符区域是否为斜体字符区域,若为是,执行S102。上述图像的字符区域可以理解为包含字符的图像中的部分区域,例如,图像中一字符行所在的区域、多个字符行所在的区域、字符行中连续的部分字符所在区域等等。其中,上述字符行可以理解为:各个字符沿水平方向依次排列形成的行。斜体字符区域是指所包含的字符为斜体字符的区域。本申请的一个实施例中,在对图像中的字符进行识别时,也就是识别图像中的字符时,可以先对图像中的字符进行定位处理,通过定位处理可以确定出图像中的各个字符行所在区域,这种情况下,上述S101中提及的字符区域可以为定位处理后得到的各个字符行所在区域。另外,字符区域中所包含的字符可以是中文简体字、中文繁体字、英文、法文、德文、日文等等中的任一字符,本申请并不对此进行限定。由于图像中字符行的方向与水平方向一致,因此,上述斜体字符可以理解为:向字符行的方向倾斜的字符,或者向水平方向倾斜的字符。例如,图2和图3a中所示的各个中文字符,沿水平方向向右倾斜,或沿字符行的方向向右倾斜。本申请的一种实现方式中,在判断出上述字符区域不是斜体字符区域时,可以结束本流程,也就是不再继续执行后续各个步骤。具体的,这种情况下,可以认为上述字符区域为正常字符区域,可以使用包含正常字符的样本图像训练的字符识别模型直接进行字符识别。S102:对字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域。上述字符倾斜程度可以理解为:字符向字符行的方向倾斜的程度。由于执行本步骤时可能还未确定字符区域中各个字符所在的具体子区域,所以进行校正处理时,可以是以整个字符区域为对象进行处理。例如,对字符区域中的各个像素点逐一进行校正处理。对字符区域进行校正处理的具体实现方式在后续实施例中进行详细说明,这里暂不详述。S103:对待识别字符区域中的字符进行字符识别。本申请的一个实施例中,对待识别字符区域中的字符进行字符识别时,可以基于预先训练好的字符识别模型,对待识别字符区域中的字符进行字符识别。本申请的一个实施例中,上述步骤S101判断图像的字符区域是否为斜体字符区域时,可以通过以下步骤A和步骤B实现。步骤A:统计图像的字符区域中纵向边缘像素点的第一数量,并统计字符区域中具有斜体字符特征的像素点的第二数量。从图2所示的字符区域中各个斜体字符可以看出,斜体字符具有以下任一特征或任意几项组合的特征:特征1:在纵向方向边缘呈锯齿状;特征2:当字符倾斜方向为:向字符右侧倾斜时,字符从上到下整体向左偏移;特征3:与向字符右侧倾斜的字符相类似,当字符倾斜方向为:向字符左侧倾斜时,字符从上到下整体向右偏移。本申请的一个实施例中,字符倾斜方向为:向字符右侧倾斜。图像的字符区域中纵向边缘像素点(x1,y1)满足以下表达式1:|gv1-gBkg|<GREY_THRESH且|gr1-gBkg|>GREY_THRESH(表达式1)其中,gv1表示坐标为(x1,y1)的像素点的灰度值,gr1表示坐标为(x1+1,y1)的像素点的灰度值,gBkg表示字符区域中各像素点的灰度平均值,GREY_THRESH表示第一预设阈值。具体的,上述第一预设阈值GREY_THRESH可以理解为:表示像素点的像素值与上述灰度平均值之间差异大小的阈值。另外,从上述描述可见,可以认为字符区域中各个像素点具有本文档来自技高网...

【技术保护点】
1.一种字符识别方法,其特征在于,所述方法包括:判断图像的字符区域是否为斜体字符区域;若为是,对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;对所述待识别字符区域中的字符进行字符识别。

【技术特征摘要】
1.一种字符识别方法,其特征在于,所述方法包括:判断图像的字符区域是否为斜体字符区域;若为是,对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;对所述待识别字符区域中的字符进行字符识别。2.根据权利要求1所述的方法,其特征在于,所述判断图像的字符区域是否为斜体字符区域,包括:统计图像的字符区域中纵向边缘像素点的第一数量,并统计所述字符区域中具有斜体字符特征的像素点的第二数量;根据所述第一数量与第二预设阈值的乘积是否小于所述第二数量,判断所述字符区域是否为斜体字符区域。3.根据权利要求2所述的方法,其特征在于,字符倾斜方向为:向字符右侧倾斜,图像的字符区域中纵向边缘像素点(x1,y1)满足以下表达式:|gv1-gBkg|<GREY_THRESH且|gr1-gBkg|>GREY_THRESH其中,gv1表示坐标为(x1,y1)的像素点的灰度值,gr1表示坐标为(x1+1,y1)的像素点的灰度值,gBkg表示所述字符区域中各像素点的灰度平均值,GREY_THRESH表示第一预设阈值;所述字符区域中具有斜体字符特征的像素点(x2,y2)满足以下表达式:|gv2-gBkg|<GREY_THRESH且|gr2-gBkg|>GREY_THRESH且|gb2-gr|<GREY_THRESH其中,gv2表示坐标为(x2,y2)的像素点的灰度值,gr2表示坐标为(x2+1,y2)的像素点的灰度值,gb2表示坐标为(x2,y2+1)的像素点的灰度值。4.根据权利要求2所述的方法,其特征在于,所述根据所述第一数量与第二预设阈值的乘积是否小于所述第二数量,判断所述字符区域是否为斜体字符区域,包括:判断所述第一数量与第二预设阈值的乘积是否小于所述第二数量;若为是,判定所述字符区域为斜体字符区域;若为否,判定所述字符区域不为斜体字符区域。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域,包括:确定所述字符区域的字符行中每一像素点的校正像素值,其中,每一像素点的校正像素值为:从该像素点开始、沿字符倾斜方向偏移目标偏移量的像素点的像素值,所述目标偏移量为:根据表达式line/ITALIC_OFFUNIT计算得到的偏移量,line表示像素点所在的像素行在字符行所包含像素行中的行号,ITALIC_OFFUNIT表示第三预设阈值;根据所述字符区域中每一像素点的校正像素值,获得对应的校正像素点,并根据所述字符区域中每一像素点对应的校正像素点,获得包含所述字符区域中所有像素点对应的校正像素点的待识别字符区域。6.一种字符识别装置,其特征在于,所述装置包括:区域判断模块,用于判断图像的字符区域是否为斜体字符区域,若为是,触发校正处理模块;所述校正处理模块,用于对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;字符识别...

【专利技术属性】
技术研发人员:贺佳
申请(专利权)人:新华三信息安全技术有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1