一种分隔页、以及利用该分隔页的文件分类的方法和装置制造方法及图纸

技术编号:3818382 阅读:238 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例提供一种分隔页、以及利用该分隔页的文件分类的方法和装置,其中所述方法包括:在对通过分隔页区分的不同类型的数个文件依序进行扫描后,按序生成包括所述分隔页和数个文件的图像;根据所述图像的几何特征查找分隔页图像;根据查找到的分隔页图像对所述不同类型的数个图像化文件进行分类。本发明专利技术实施例的优点在于:通过设计一种简单的分隔页,可以使得在对图像化的文件进行分类时提高识别分隔页的效率,进而可以根据识别出的分隔页对不同类型的文件进行分类操作,使得对文件的分类不仅简单、方便、快速,而且无需更改硬件配置。

【技术实现步骤摘要】

本专利技术涉及图像信息
,特别涉及一种分隔页、以及利用该分隔 页进行文件分类的方法和装置。
技术介绍
随着数字技术的发展,对文件的分类与管理也更多通过数字化的方式来 实现。比如将纸件文件扫描成数字图像后,通过对这些数字图像的识别、分 类达到对图像化文件的管理。但由于文件的类型往往很多,所以在扫描前要 先将相同类型的文件叠放在一起,通过在不同类型的文件之间插入分隔页已 区分文件类型,依序经过文件扫描仪扫描后形成对应文件的图像,此时只要 识别出分隔页的图像,就能自动对相应类型的文件图像进行分类和管理。但是,专利技术人在实现本专利技术的过程中发现现有技术中存在的缺陷在于 现有的分隔页主要采用条形码或者厂商自己设计的图码来进行识别,这样使 得分隔页的设计、制作以及对其识别都比较复杂。以条形码分隔页为例,由 于条形码所能代表的数值范围大,所以适用于文档类别较多的情况,是目前 应用最普遍的一种,但是条形码不仅需要专业的软件来设计,而且需要采用 复杂的图像识别技术来读取条形码所代表的数值,从而使得识别时间较长, 并且通过识别条形码来识别分隔页也不是很准确。例如以扫描1000张的文件图像做测试,Kofax公司的专业扫描文档处理产品Ascent Capture,所提供的 不带VRS (VirtualReScan,虚拟重扫描)功能的条形码分隔页页面识别方式, 仅分类识别需要的时间就在10分钟以上,而该产品提供的带VRS功能的条 形码识别方式,虽然可以较快的实现产生扫描图片的同时即判断识别出分隔页,但是该方式需要相关硬件的支持,而且售价昂贵。所以,如何设计一种分隔页以使得在文件分类中能快速、准确的识别出 分隔页从而方便文件分类及管理己成为本领域技术人员长期希望解决的技术 问题。
技术实现思路
本专利技术实施例的目的在于提供一种分隔页、以及利用该分隔页进行文件 分类的方法和装置,本领域技术人员通过本专利技术实施例提供的分隔页、以及 利用该分隔页进行文件分类的方法和装置,可以快速、准确的识别出图像化 的分隔页,从而根据识别出的分隔页对文件进行分类和管理,大大提高了文 件分类的效率。为实现上述目的,本专利技术实施例提供一种文件分类的方法,所述方法包括在对通过分隔页区分的不同类型的数个文件依序进行扫描后,按序生成 包括所述分隔页和数个文件的图像;根据所述图像的几何特征查找分隔页图像;根据査找到的分隔页图像对所述不同类型的数个图像化文件进行分类。 为实现上述目的,本专利技术实施例还提供一种文件分类的装置,所述装置 包括图像生成单元,用于在对通过分隔页区分的不同类型的数个文件依序进 行扫描后,按序生成包括所述分隔页和数个文件的图像;分隔页图像査找单元,用于根据所述图像的几何特征査找分隔页图像;文件分类单元,用于根据查找到的分隔页图像对所述不同类型的数个图 像化文件进行分类。为实现上述目的,本专利技术实施例还提供一种分隔页,用于放置在不同类 别的文件之间以区分文件类型,其中所述分隔页的形状为正方形,所述分隔页一面颜色为深色。本专利技术实施例的有益效果在于,通过设计一种简单的分隔页,可以使得 在对图像化的文件进行分类时提高识别分隔页的效率,进而可以根据识别出 的分隔页对不同类型的文件进行分类操作,使得对文件的分类不仅简单、方 便、快速,而且无需更改硬件配置。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部 分,并不构成对本专利技术的限定。在附图中图1是本专利技术实施例一的方法流程框图。 图2是本专利技术实施例二的方法流程框图。 图3是本专利技术实施例三的装置功能结构框图。 图4是本专利技术实施例三的分隔页的示意图。具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚明白,下面结合附图对本 专利技术实施例做进一步详细说明。本专利技术实施例以对银行票据进行分类为例, 通过本专利技术实施例所提供的分隔页对不同类型的票据进行分类,以使得在快 速识别出图像化的分隔页后,可以对不同类型的银行票据进行分类。在此, 本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限 定。实施例一本专利技术实施例提供一种票据分类的方法,如图1所示,所述方法包括101. 在对通过分隔页区分的不同类型的数个票据依序进行扫描后,按序 生成包括所述分隔页和数个票据的图像;102. 根据各个图像的几何特征査找分隔页图像;103. 根据査找到的分隔页图像对所述不同类型的数个图像化票据进行分类。本实施例中在对票据进行扫描前,用户会先将不同类型的票据分类,并 且不同类型的票据之间放置有分隔页,比如支票分为一类,汇票再分为一类, 最后一张支票与第一张汇票之间放置有一分隔页。用户将叠好的票据放置扫描仪处进行扫描,扫描仪顺序对叠好的票据进行扫描,步骤101使得终端根据扫描的顺序生成对应票据和分隔页的图像,本实施例中的扫描仪为专用的文件扫描仪,如柯达i660,富士通6670,这种扫描仪对票据和分隔页正反 两面都会进行扫描,对应每张票据和分隔页都会生成两幅图像。扫描完成后 终端就会获得对应每张票据和分隔页的图像,然后就要查找出分隔页,因为 只要查找出分隔页就能对图像化的票据进行分类。本实施例的步骤102主要 是根据各个图像的几何特征查找分隔页图像。由于票据形状几乎为长方形, 所以只要将分隔页的几何形状设计成不同于长方形的形状就能查找出分隔页 的图像。最容易査找的形状就是将分隔页设计成正方形, 一旦获取到的分隔 页图像的高度和宽度相同就说明该图像是分隔页对应的图像。当查找到分隔 页图像后,即可根据步骤103对所述不同类型的数个图像化票据进行分类。 因为生成图像时终端会给每个生成的图像进行命名,这种命名通常是根据生 成图像的顺序依序对图像以数字进行标记,所以每幅图像的数字名称及即对 应票据或分隔页在扫描时的序号,当查找到分隔页后,也即获取到了改分隔 页的数字名称,所以根据数字名称即可获得分隔页前面的所有支票的数字和 后面的所有汇票的数字,从而获得所有支票和所有汇票并将两种票据分开为 后续管理提供方便。本专利技术实施例的优点在于,在对图像化的文件进行分类时提高识别分隔 页的效率,进而可以根据识别出的分隔页对不同类型的文件进行分类操作, 使得对文件的分类不仅简单、方便、快速,而且无需更改硬件配置。实施例二本专利技术实施例提供一种票据分类的方法,如图2所示,所述方法包括以下步骤201.在对通过分隔页区分的不同类型的数个票据依序进行扫描后,按序 生成包括所述分隔页和数个票据的图像;本步骤与实施例1中的101类似,在对票据进行扫描前,用户会先将不 同类型的票据分类,并且不同类型的票据之间放置有分隔页。该分隔页为正 方形,正面颜色全部为深色,如黑色,背面标记有文件类型号,不同分隔页 的边长不同。相同类型的票据被分配在一起后,在最后一张票据之后放置分 隔页,以此区分相叠在一起的其他类型的票据。用户将叠好的票据放置扫描 仪处进行扫描,扫描仪顺序对叠好的票据进行扫描,使得终端计算机根据扫 描的顺序生成对应票据和分隔页的图像,本实施例中的扫描仪为专用的文件 扫描仪,这种扫描仪对票据和分隔页正反两面都会进行扫描,每张票据和分 隔页都会生成两幅图像。扫描完成后终端就会获得每张票据和分隔页的图像, 并且每张图像都根据生成顺序依序编号,这样生成的所有本文档来自技高网
...

【技术保护点】
一种文件分类的方法,其特征在于,所述方法包括: 在对通过分隔页区分的不同类型的数个文件依序进行扫描后,按序生成包括所述分隔页和数个文件的图像; 根据所述图像的几何特征查找分隔页图像; 根据查找到的分隔页图像对所述不同类型的 数个图像化文件进行分类。

【技术特征摘要】

【专利技术属性】
技术研发人员:李剑锋蒋韧
申请(专利权)人:交通银行股份有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利