一种票据字符校正的方法及装置制造方法及图纸

技术编号:14647942 阅读:50 留言:0更新日期:2017-02-16 05:00
本发明专利技术属于票据图像识别技术领域,提供票据字符校正的方法及装置,旨在解决现有字符倾斜校正方法用于“票据字符发生不同程度倾斜,而且每个字符的倾斜程度均不同”的这种情况对倾斜字符进行整体校正时,一方面某些字符依旧倾斜严重,另一方面整幅票据图像进行校正,增加了算法时间复杂度,降低了算法效率,的问题。相对于现有技术整幅票据图像进行校正来解决字符倾斜,本申请对于单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域进行校正,使每个字符倾斜角度控制在不影响字符识别的范围内,且避免了对整幅票据图像进行校正,降低了算法时间复杂度,提高识别效率。

【技术实现步骤摘要】

本专利技术属于票据图像识别
,尤其涉及一种票据字符校正的方法及装置
技术介绍
票据票面上的字符是记录、分析信息的一种重要标记和可靠途径。有价票据、尤其是银行票据作为一种广泛使用的结算方式,其票面字符的自动化识别尤为重要,OCR(OpticalCharacterRecognition,光学字符识别)处理技术作为文字识别和文档分析领域的一个研究热点在有价票据字符识别中的广泛应用也印证了这点。有价票据文件的字符识别一般包括图像预处理、倾斜校正、字符定位和字符识别等过程。票据图像采集中会出现整行字符的整体倾斜,倾斜后整体还在一条直线上,所有字符的倾斜角度一样,利用如上特征,通过对整幅票据图像进行校正可以解决字符倾斜的问题。专利技术人发现票据图像采集过程中,由于运动、挤压等原因造成票据字符发生不同程度倾斜,而且每个字符的倾斜程度均不同。
技术实现思路
本专利技术实施例提供一种票据字符校正的方法,旨在解决上述现有字符倾斜校正方法用于“票据字符发生不同程度倾斜,而且每个字符的倾斜程度均不同”的这种情况对倾斜字符进行整体校正时,一方面某些字符依旧倾斜严重,另一方面整幅票据图像进行校正,增加了算法时间复杂度,降低了算法效率的问题。本专利技术实施例的第一方面,提供一种票据字符校正的方法,所述方法包括:检测票面图像中的单个字符;确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。本专利技术实施例的第二方面,提供一种票据字符校正的装置,所述装置包括:检测模块,用于检测票面图像中的单个字符;确定模块,用于确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算模块,计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;校正模块,用于根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。本专利技术实施例与现有技术相比存在的有益效果是:提供一种票据校正的方法,检测票面中的单个字符;确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。相对于现有技术整幅票据图像进行校正来解决字符倾斜,本技术方案对于每个字符单独进行倾斜校正,可使每个字符相对于票据来说,倾斜角度控制在不影响字符识别的范围内,可提高字符自动识别的效率,而且避免了对整幅票据图像进行旋转校正,降低了算法的时间复杂度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1-1是本专利技术实施例一提供的票据字符校正的方法实现流程图;图1-2是本专利技术实施例一提供的单个字符的最小外接矩形示意图;图1-3是本专利技术实施例一提供的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域示意图;图1-4是本专利技术实施例一提供的计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度和计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线与所述对称轴的夹角在预设范围内的示意图;图2是本专利技术实施例二提供的票据字符校正的装置结构示意图;图3是本专利技术实施例三提供的票据字符校正的装置结构示意图;图4-1是本专利技术实施例四提供的票据字符校正的装置结构示意图;图4-2是本专利技术实施例四提供的票据字符校正的装置结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。以下描述中,为了说明而不是为了限定,给出了诸多技术特征的说明示意图,以便透切理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的装置以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。实施例一:票据包括各种有价证券和凭证,例如股票、国库券、企业债券、发票、提单等,其形状绝大部分是对称形状,尤其是矩形。为了有效解决现有字符倾斜校正方法用于“票据字符发生不同程度倾斜,而且每个字符的倾斜程度均不同”的这种情况对倾斜字符进行整体校正时,一方面某些字符依旧倾斜严重,另一方面整幅票据图像进行校正,增加了算法时间复杂度,降低了算法效率的问题。本实施例提供的票据字符校正的方法包括:检测票面图像中的单个字符;确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。图1-1示出了本专利技术实施例一提供的票据字符校正的方法实现流程图,为了便于说明,图1-1仅示出了与本实施例相关的部分,其过程详述如下:在步骤S101中,检测票面图像中的单个字符。优选的是,票面中的单个字符可以是世界各个国家或地区或民族用的文字、数字的各种字体的印刷体或手写体,例如阿拉伯数字、汉语拼音字母、汉字、大小英文字母等。优选的是,根据字符在票据票面中的特征,例如字符区域与背景像素亮度值明显不同或字符轮廓或多个字符组成一串的连续性的特征,对票据票面进行二值化后,进行单个字符检测,此方法简单高效。优选的是,可以根据每种票据中字符所处的位置在票据票面预设的区域内进行单个字符的检测,此方法检测范围固定,目标性强,可提高检测效率。需要说明的是,本实施例检测票面中的单个字符,指出了处理对象是针对单个字符,为后续其它技术特征奠定了基础,也是本申请核心要点,这不同于现有技术中对整幅票据图像进行处理,提高了处理效率。在步骤S102中,确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。鉴于最小外接矩形可能存在两种不同定义,第一种定义为最小面积矩形,第二种定义为以二维坐标表示的若干二维形状(例如点、直线、多边形)的最大范围,即以给定的二维形状各顶点中的最大横坐标、最小横坐标、最大纵坐标、最小纵坐标定下边界的矩形。本实施例中的最小外接矩形指最小面积外接矩形,图1-2中示出了本实施例中提供的单个字符的最小外接矩形示意图。为了便于理解,建立辅助直角坐标系xoy,本文档来自技高网...
一种票据字符校正的方法及装置

【技术保护点】
一种票据字符校正的方法,其特征在于,所述方法包括:检测票面图像中的单个字符;确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。

【技术特征摘要】
1.一种票据字符校正的方法,其特征在于,所述方法包括:检测票面图像中的单个字符;确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。2.如权利要求1所述的方法,其特征在于,所述确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,包括:查找所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。3.如权利要求2所述的方法,其特征在于,所述排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,包括:根据预设的字符高度、宽度、及高度、宽度的比值的范围中至少一个,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;根据所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中心的预设范围,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;根据所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域与其它所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域形成重叠区域的情形,排除所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中至少一个。4.如权利要求3所述的方法,其特征在于,所述情形为所述重叠区域的形状和/或测量的所述重叠区域的尺寸和/或面积。5.如权利要求1至4中任意一项所述的方法,其特征在于,所述根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域,包括:将所述倾斜角度与预设角度范围进行比较;若所述倾斜角度属于预设角度范围,则对所述最小外接矩形外侧预设缓冲区范围内的矩形区域进行顺时针或逆时针旋转。...

【专利技术属性】
技术研发人员:翟云龙
申请(专利权)人:深圳怡化电脑股份有限公司深圳市怡化时代科技有限公司深圳市怡化金融智能研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1