票据图象版面识别方法技术

技术编号:2933712 阅读:175 留言:0更新日期:2012-04-11 18:40
一种票据图象处理过程中的版面识别方法,其特征在于包括: 输入待识别版面的图象,对该图象进行版面预处理; 利用预处理后图象中的特征线条或特征文字与预先存储的每一个标准版面的标准线条或标准文字进行匹配,根据匹配可信度确定待识别版面。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种图象处理方法,尤其是一种对票据版面图象的识别处理方法。在现有的票据版面的识别方法中,通常采用下述步骤实现,首先在计算机系统中存储与待识别版面有关的标准版面信息的数据,这里的标准版面数据是依据某种对比规则进行版面匹配时需要的标准版面的特征数据;其次对待识别的票据进行图象扫描,根据扫描得到的图象进行特征数据的提取,最后根据提取出的特征数据进行相似性判断,从而确定最佳匹配的版面。上述过程中,人们普遍关注的是标准票据版面的特征数据的确定和在待识别的图象中提取特征数据的简单和易实现性,这关系到提取出的特征数据的质量,从而影响票据识别的效率。因此,如何能够采用简单易行的票据版面图象的识别方案,是人们一直渴望解决的问题。基于上面所述,本专利技术的目的在于,提供一种简单、易实现的票据图象处理过程中的版面识别方法。为达到上述目的,本专利技术提供的票据图象处理过程中的版面识别方法,包括输入待识别版面的图象,对该图象进行版面预处理;利用预处理后图象中的特征线条或特征文字与预先存储的每一个标准版面的标准线条或标准文字进行匹配,根据匹配可信度确定待识别版面。所述利用预处理后图象中的特征线条或特征文字与预先存储的所有标准版面的标准线条或标准文字进行匹配的步骤可以包括在预处理后的图象中查找特征线条;判断查找到的特征线条是否足够,如果足够,利用所述特征线条与预先存储的所有标准版面的标准线条进行匹配;否则,在预处理后的图象中查找特征文字,利用所述特征文字与预先存储的所有标准版面的标准文字进行匹配。所述利用预处理后图象中的特征线条或特征文字与预先存储的所有标准版面的标准线条或标准文字进行匹配的步骤也可以包括在预处理后的图象中查找特征文字;判断是否查找到特征文字,如果找到,利用所述特征文字与预先存储的所有标准版面的标准文字进行匹配;否则,在预处理后的图象中查找特征线条,利用所述特征线条与预先存储的所有标准版面的标准线条字进行匹配。在上述步骤中,所述查找特征线条包括按照下述步骤查找横线11)对待测试版面进行逐行逐点扫描,当扫描到黑点b_dot时,转步骤12),当扫描到白点w_dot时,转步骤13);12)判断点b_dot是否为一条线段左端点,如果是,则转步骤11),并开始进行找线操作;否则,判断点b_dot是否为一条线段中的一点,如果是,将该点记入线长,转步骤11)继续扫描下一个点;否则,判断点b_dot是否为一行的末尾,且不是一条线上的点,如果是,则转步骤11)进行下一行扫描;否则,转步骤15)做找线完毕处理; 13)判断点w_dot之前是否找到线,如果否,转步骤11)继续扫描后续的点;否则,判断点w_dot是否为一条线段中断线部分的白点,如果是,转步骤14)进行断线处理;否则,判断点w_dot是否为一条线段的结束点,如果是,转步骤15)做找线完毕处理;否则转步骤16);14)将点w_dot作为黑点b_dot,转步骤12);15)保存找到的线条;16)判断待测试版面是否扫描结束,如果未结束,转步骤11)继续扫描,否则结束扫描。在步骤13)中,按照下述步骤判断点w_dot是否为一条线段中断线部分的白点在断线长度允许的范围内,以当前行为基准线,上下偏移指定行,从该白点的横坐标开始查找黑点,若在这个范围内没有找到黑点,则判定该点是一条线段的结束,否则判定该白点为一条线中的断线部分。在步骤16)判断待测试版面是否扫描结束前,还包括判断线段合格性的步骤。所述查找特征线条的操作,还包括按照下述步骤查找竖线21)将待测试版面翻转90度,以使竖线转变为横线;22)查找横线;23)将所述横线的坐标转换为竖线的坐标。在根据匹配结果确定待识别版面的步骤前还包括确定待识别版面的匹配点。采用下述步骤确定待识别版面的匹配点确定所有横线与竖线的交点;在上述交点中,选择横坐标与纵坐标之差最小的交点作为匹配点。基于上面所述,按照下述步骤实现所述特征线条与预先存储的每一个标准版面的标准线条的匹配31)读取预先存储的标准版面; 32)以匹配点为标准,计算待测试版面与标准版面中的横线匹配率,以及计算待测试版面与标准版面中的竖线匹配率;33)根据所述横线匹配率和竖线匹配率确定对该标准版面的匹配可信度。确定待测试版面与标准版面中的横线匹配率按照下述步骤进行41)计算待测试版面与标准版面的累计横线匹配率;42)横线匹配率=累计横线匹配率×2/(测试版面的横线数目+标准版面的横线数目)。所述累计横线匹配率按照下述步骤确定51)初始化累计横线匹配率bMatchH=0;52)从待测试版面的横线集合中,选择一条未被选择的横线LineT,当没有可选择的横线LineT时,结束操作,否则转步骤53);53)计算横线LineT的长度LT,以及它离匹配点OrgT的垂直距离DVT和水平距离DHT;54)从标准版面的横线集合中,选择一条未被选择的横线LineS,当没有可选择的横线LineS时,转步骤52),否则转步骤55);55)计算横线LineS的长度LS,以及它离匹配点OrgS的垂直距离DVS和水平距离DHS;56)判断DVT与DVS差的绝对值a是否大于对应的设定值V或者DHT与DHS差的绝对值b是否大于对应的设定值H或者LT与LS差的绝对值c是否大于对应的设定值L,如果大于,转步骤54),否则,按照下式计算匹配率matchLmatchL=((a/V)2+(b/L)2+(c/L)2)/3;57)将matchL累加到bMatchH,然后转步骤54)。按照下述步骤确定待测试版面与标准版面中的竖线匹配率61)将待测试版面翻转90度,以使竖线转变为横线;62)计算待测试版面与标准版面的累计横线匹配率,以所述累计横线匹配率作为累计竖线匹配率;63)竖线匹配率=累计竖线匹配率×2/(测试版面的竖线数目+标准版面的竖线数目)。所述查找特征文字的步骤包括71)查找版面的特征匹配点;72)读取预先存储的标准版面信息,根据所述信息在预处理后的图象中抠取指定的图象块;73)在所述图象块中查找特征文字。由于本专利技术采用以待识别版面中线条或文字为识别特征,与预先存储的每一个标准版面的标准线条或标准文字进行匹配,最后根据匹配可信度确定待识别版面的方法进行版面的识别,方法简单且容易实现,并且具有较高的版面识别效率。附图说明图1是本专利技术所述方法实施例的主流程图。在图1所示的流程中,描述了本专利技术所述方法的主要要点对通过扫描票据得到的待识别的版面图象进行线条或文字查询,利用查询得到的特征线条或特征文字与预先存储的标准版面的标准线条或标准文字进行对比,根据对比的结果确定被识别的票据属于什么票据。根据图1的指示,要实现本专利技术所述的方法,首先要将根据标准票据获得的用于对待识别票据版面进行识别使用的标准信息存储起来,如存储到系统的数据库中,以作为识别对比的依据。根据所处理票据性质的不同,所述标准信息可以采用不同特征,如特征线条、特征点、以及特征文字信息等能够代表票据图象版面的特征,本实施例中的标准数据包括模板版面名称,以及模板中的所有标准横线条坐标、竖线条坐标,文字内容及坐标、匹配点等,还包括其它一些经验值,例如线条的最短长度、线条长度误差,以及线条到版面匹配点的垂直距离、水平距离及其误差范围等。以标准信息为基础本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:蔡亮陈宇周昕
申请(专利权)人:杭州信雅达系统工程股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利