The embodiment of this application provides a character recognition method and device, which relates to the field of information processing technology. The method includes: judging whether the character area of an image is an italic character area; correcting the character area to reduce the inclination of the character to obtain the character area to be recognized; and recognizing the character in the character area to be recognized. The scheme provided in the embodiment of this application is applied for character recognition, and the accuracy of character recognition for italic characters can be improved when using a character recognition model trained with sample image containing normal characters.
【技术实现步骤摘要】
一种字符识别方法及装置
本申请涉及信息处理
,特别是涉及一种字符识别方法及装置。
技术介绍
在人工智能技术高速发展的今天,基于图像进行字符识别的需求越来越多。在基于图像进行字符识别时,需获取大量样本图像,然后基于这些样本图像训练字符识别模型,并通过训练好的字符识别模型识别图像中的字符。由于实际应用中大多数字符均为正常字符,也就是不具有倾斜度的字符,所以在训练上述字符识别模型时,所采用的样本图像一般为包含正常字符的图像。由于正常字符与斜体字符的特征不同,这样在图像中包含斜体字符的情况下,仍然采用上述字符识别模型进行字符,易导致准确度较低。
技术实现思路
本申请实施例的目的在于提供一种字符识别方法及装置,以在使用包含正常字符的样本图像训练的字符识别模型进行字符识别时,提高对斜体字符进行字符识别的准确度。具体技术方案如下:第一方面,本申请实施例提供了一种字符识别方法,所述方法包括:判断图像的字符区域是否为斜体字符区域;若为是,对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;对所述待识别字符区域中的字符进行字符识别。第二方面,本申请实施例提供了一种字符识别装置,所述装置包括:区域判断模块,用于判断图像的字符区域是否为斜体字符区域,若为是,触发校正处理模块;所述校正处理模块,用于对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;字符识别模块,用于对所述待识别字符区域中的字符进行字符识别。第三方面,本申请实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器 ...
【技术保护点】
1.一种字符识别方法,其特征在于,所述方法包括:判断图像的字符区域是否为斜体字符区域;若为是,对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;对所述待识别字符区域中的字符进行字符识别。
【技术特征摘要】
1.一种字符识别方法,其特征在于,所述方法包括:判断图像的字符区域是否为斜体字符区域;若为是,对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;对所述待识别字符区域中的字符进行字符识别。2.根据权利要求1所述的方法,其特征在于,所述判断图像的字符区域是否为斜体字符区域,包括:统计图像的字符区域中纵向边缘像素点的第一数量,并统计所述字符区域中具有斜体字符特征的像素点的第二数量;根据所述第一数量与第二预设阈值的乘积是否小于所述第二数量,判断所述字符区域是否为斜体字符区域。3.根据权利要求2所述的方法,其特征在于,字符倾斜方向为:向字符右侧倾斜,图像的字符区域中纵向边缘像素点(x1,y1)满足以下表达式:|gv1-gBkg|<GREY_THRESH且|gr1-gBkg|>GREY_THRESH其中,gv1表示坐标为(x1,y1)的像素点的灰度值,gr1表示坐标为(x1+1,y1)的像素点的灰度值,gBkg表示所述字符区域中各像素点的灰度平均值,GREY_THRESH表示第一预设阈值;所述字符区域中具有斜体字符特征的像素点(x2,y2)满足以下表达式:|gv2-gBkg|<GREY_THRESH且|gr2-gBkg|>GREY_THRESH且|gb2-gr|<GREY_THRESH其中,gv2表示坐标为(x2,y2)的像素点的灰度值,gr2表示坐标为(x2+1,y2)的像素点的灰度值,gb2表示坐标为(x2,y2+1)的像素点的灰度值。4.根据权利要求2所述的方法,其特征在于,所述根据所述第一数量与第二预设阈值的乘积是否小于所述第二数量,判断所述字符区域是否为斜体字符区域,包括:判断所述第一数量与第二预设阈值的乘积是否小于所述第二数量;若为是,判定所述字符区域为斜体字符区域;若为否,判定所述字符区域不为斜体字符区域。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域,包括:确定所述字符区域的字符行中每一像素点的校正像素值,其中,每一像素点的校正像素值为:从该像素点开始、沿字符倾斜方向偏移目标偏移量的像素点的像素值,所述目标偏移量为:根据表达式line/ITALIC_OFFUNIT计算得到的偏移量,line表示像素点所在的像素行在字符行所包含像素行中的行号,ITALIC_OFFUNIT表示第三预设阈值;根据所述字符区域中每一像素点的校正像素值,获得对应的校正像素点,并根据所述字符区域中每一像素点对应的校正像素点,获得包含所述字符区域中所有像素点对应的校正像素点的待识别字符区域。6.一种字符识别装置,其特征在于,所述装置包括:区域判断模块,用于判断图像的字符区域是否为斜体字符区域,若为是,触发校正处理模块;所述校正处理模块,用于对所述字符区域进行减轻字符倾斜程度的校正处理,获得待识别字符区域;字符识别...
【专利技术属性】
技术研发人员:贺佳,
申请(专利权)人:新华三信息安全技术有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。