票据信息区域自动识别和提取方法及设备技术

技术编号：8934631 阅读：195 留言：0更新日期：2013-07-18 03:14

本发明专利技术提供票据信息区域自动识别和提取方法及设备，涉及计算机图像处理和信息识别领域。本发明专利技术通过票据图像预处理、利用预先通过信息区域训练自学习而构建的信息区域特征数据库进行信息区域识别、边界和底纹处理、字符区域增强处理、信息区域提取等处理，能够以良好的准确率和适应性自动地识别和提取多类票据中的感兴趣区域信息，从而节省票据处理的人力和时间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机图像处理和信息识别领域，尤其是票据的信息区域的自动识别和提取技术。
技术介绍
现代社会的各种商业活动，特别是银行业务，广泛使用各种票据。例如，随着现代社会的发展，人们越来越多地使用支票代替现金进行消费和结算。支票等票据的广泛使用必然导致票据的存储、管理以及票据信息的查找愈来愈麻烦。虽然目前在银行等有关行业广泛使用计算机来管理海量票据信息，但是向计算机系统人工输入票据信息需耗费大量的人力和时间。为此，有人提出了可以自动识别票据中的区域信息的票据自动识别技术，能够从票据中自动提取有用信息，并按照一定的分类规则保存到数据库中供用户检索查询，从而减少用户的工作量。然而，目前的票据自动识别技术存在以下问题:首先，票据格式多种多样，没有统一的识别格式，目前没有快速有效的分类方式来识别票据的样式；其次，票据大多由人用笔填写，之后通过扫描等手段输入计算机识别系统，其中的污损、残缺、摆放不正等因素都会极大地影响系统的识别准确率；第三，目前针对票据的识别方式都是通过版面分类的方式进行预处理，这对于规规矩矩的扫描件是有效的，而对于票据形状、扫描坐标、旋转、倾斜度等处理效率都不高。
技术实现思路
为了克服现有技术存在的上述问题，本专利技术提供一种票据信息区域自动识别和提取技术，能够以良好的准确率和适应性自动地识别和提取多类票据中的感兴趣区域信息，从而节省票据处理的人力和时间。根据本专利技术的一种票据信息区域自动识别和提取方法包括以下步骤:票据图像预处理，包括对票据图像进行去黑边、去噪点、纠偏以及灰度化处理；利用预先通过信息区域训练自学习而构建的信息区域特征数据库...

【技术保护点】
一种票据信息区域自动识别和提取方法，包括以下步骤：票据图像预处理，包括对票据图像进行去黑边、去噪点、纠偏以及灰度化处理；利用预先通过信息区域训练自学习而构建的信息区域特征数据库，对经过预处理的票据图像进行信息区域识别；边界和底纹处理，包括对所识别的信息区域进行重叠区域合并、去除底纹干扰、突出字符颜色以及二值化处理；字符区域增强处理，包括对经过边界和底纹处理的信息区域中的字符区域进行字符区域分割和膨胀腐蚀处理；以及提取经过字符区域增强处理的各个信息区域。

【技术特征摘要】

【专利技术属性】
技术研发人员：谭宜勇，张屹，吴玉峰，郑邦东，
申请(专利权)人：北京英迈杰科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人