基于影像档案电子资料识别系统中分类器的识别方法技术方案

技术编号：10352268 阅读：154 留言：0更新日期：2014-08-25 11:16

本发明专利技术提供一种基于影像档案电子资料识别系统中分类器的识别方法，在识别系统中设置分类器，对图像的识别信息进行分类得到不同的信息项，为每个信息项构建相应的查找表，以查找表中的内容对识别信息进行比对。本发明专利技术能够自动识别扫描图像，从中提取有用信息，并按照一定的分类规则保存到数据库中，供用户检索、查询，最大程度减少用户的工作量。本发明专利技术利用多分类器融合方法来提高字符的识别率；利用格式模板，并运用多区域多内容冗余校验的方法对不同信息项内容进行比对，保证识别结果的充分可信赖性，提高了识别效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据管理系统领域，特别涉及一种。
技术介绍
现代社会中，纸质文档(例如银行票据凭证、个人信息表等等)仍然被广泛使用，对纸质文档的存储、管理及文件上的信息归类、查找都十分困难。计算机和智能手机的普及，使得通过电子方法对纸质文档进行管理成为可能，但是将纸质文档上的信息通过人工输入电子系统需要耗费大量的时间和人力；而通过智能系统自动识别票据内容还存在很多局限。诸如银行业务中，票据上的大量信息都是打印上去的印刷体的数字及中英文字符，准确提取并识别这些信息对票据自动处理有着重要作用。然而，由于票据版面的复杂性和识别要求的特殊性，在实际系统中可能会遇到各种困难:票据版面上存在印章、油墨、手写信息、背景图案等等干扰信息；另外票据上还会出现字符粘连、字体字号变化频繁、识别信息不全等问题。针对于银行系统中的兑付业务而言，其过程是将每个柜员办理的业务票据与电脑中存储的流水信息进行比对，以检查操作员是否进行了误操作；如果票据内容识别错误会导致账目不平的后果。近些年来，相对于设计更复杂的分类器来提高识别率来说，人们更倾向于将一些单个的分类器融合起来以获得更高的性能。多分类器融合算法包括两个基本途径:多个分类器的融合，也就是将每个分类器的输出结果按照特定的融合规则进行融合来得到最终的分类结果；动态分类器选择，也就是对于特定类型的待识别模式动态选择最有可能分类正确的分类器进行分类。目前在自动识别系统中，多分类器融合方法得到了很好地应用。
技术实现思路
为了解决上述现有问题，本专利技术提供了一种，对识别结果进行分类后按相应的格式模板进行识别，有效提高识别效率和准...

【技术保护点】
一种基于影像档案电子资料识别系统中分类器的识别方法，其特征在于，在识别系统中设置分类器，对图像的识别信息进行分类得到不同的信息项，为每个信息项构建相应的查找表，以查找表中的内容对识别信息进行比对。

【技术特征摘要】
1.一种基于影像档案电子资料识别系统中分类器的识别方法，其特征在于，在识别系统中设置分类器，对图像的识别信息进行分类得到不同的信息项，为每个信息项构建相应的查找表，以查找表中的内容对识别信息进行比对。2.如权利要求1所述的识别方法，其特征在于，将信息项划分为具有上下顺位的不同类别，为不同类别的信息项对应设置有对应级别的查找表。3.如权利要求1所述的识别方法，其特征在于，记录信息项之间的关联情况，对任意一个信息项的内容通过与之关联的信息项的内容进行验证。4.如权利要求1所述的识别方法，其特征在于，通过与信息项对应的格式模板进行信息识别；所述格式模板中定义了信息项的固有位置、固有格式、固有内容、固有表达方式中的一项或若干项的组合。5.如权利要求1所述的识别方法，其特征在于，所述识别系统中设置有信息识别模块，对图像中的信息进行初步识别；再通过所述分类器，对初步识别后的信息进行分类；之后，将分类结果反馈至所述信息识别模块进行精确识...

【专利技术属性】
技术研发人员：林珉，
申请(专利权)人：上海珉智信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人