一种混贴票据的识别切割方法以及系统技术方案

技术编号:37542606 阅读:14 留言:0更新日期:2023-05-12 16:11
本发明专利技术提供了一种混贴票据的识别切割方法以及系统,本发明专利技术的混贴票据的识别切割方法的步骤包括:对票据检测之后得到多个单张票据的掩码数据,根据设定的阈值对所述掩码数据进行过滤以获得符合条件的掩码数据;上述符合条件的掩码数据进行掩码合并之后,计算最小外包矩形,将得到的最小外包矩形位置使用数组方式进行切割。本发明专利技术的混贴票据的识别切割方法对不同票据进行检测,不会存在漏检检测,准确率很高,有效地提高文档分类的效率与准确率,节省人力,具有巨大的应用价值。具有巨大的应用价值。具有巨大的应用价值。

【技术实现步骤摘要】
一种混贴票据的识别切割方法以及系统


[0001]本专利技术涉及混贴票据处理领域,具体而言,涉及一种混贴票据的识别切割方法以及系统。

技术介绍

[0002]在企业经营活动中,一直伴随着种类繁多的票据,包括增值税发票、定额发票、通用机打发票、差旅报销发票等等。在财务做归档整理过程中,使用手工方式对多张混贴票据信息进行统计和整理也一直是一项非常繁重的工作,而且非常容易出错;特别是存在大量多张混贴票据进行识别的场景下,环境的复杂性也影响着票据识别和分类的准确度。
[0003]现有技术中的混贴票据识别的难点在于:(1)混贴票据的背景复杂,票据粘贴之后的重叠度较高,这些会对票据的检测造成很大的干扰;(2)票据类别多样,对于不同样式的票据进行检测是一个难点。并且目前的票据识别切割方法操作方法均比较单一,在实际应用环境下容易造成漏检。
[0004]有鉴于此,特提出本专利技术。

技术实现思路

[0005]有鉴于此,本专利技术公开了一种混贴票据的识别切割方法,该识别切割方法充分利用了图像处理技术,整个图像处理过程操作简单,通过分类切割的方式实现了对不同票据进行检测,不会存在漏检检测,准确率很高,有效地提高文档分类的效率与准确率,节省人力,具有巨大的应用价值。
[0006]具体地,本专利技术是通过以下技术方案实现的:
[0007]第一方面,本专利技术公开了一种混贴票据的识别切割方法,包括如下步骤:
[0008]对票据检测之后得到多个单张票据的掩码数据,根据设定的阈值对所述掩码数据进行过滤以获得符合条件的掩码数据;
[0009]将上述符合条件的掩码数据进行掩码合并之后,计算最小外包矩形,将得到的最小外包矩形位置使用数组方式进行切割。
[0010]第二方面,本专利技术公开了一种混贴票据的识别切割系统,包括:
[0011]掩码处理模块:用于对票据检测之后得到多个单张票据的掩码数据,根据设定的阈值对所述掩码数据进行过滤以获得符合条件的掩码数据;
[0012]切割模块:用于将上述符合条件的掩码数据进行掩码合并之后,计算最小外包矩形,将得到的最小外包矩形位置使用数组方式进行切割。
[0013]第三方面,本专利技术公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述混贴票据的识别切割方法的步骤。
[0014]第四方面,本专利技术公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述混贴票据的识别切割方法的步骤。
[0015]总之,通过采用本专利技术的混贴票据的识别切割方法以及系统,达到结合掩码信息与图像特征匹配实现混贴票据的精确识别与切割的目的。
附图说明
[0016]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0017]图1为本专利技术实施例提供的混贴票据的识别切割方法的操作流程图;
[0018]图2为本专利技术实施例提供的混贴票据的识别切割系统的结构示意图;
[0019]图3为本专利技术实施例提供的一种计算机设备的流程示意图。
具体实施方式
[0020]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0021]在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0022]应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0023]本专利技术公开了一种混贴票据的识别切割方法,参照图1所示,包括如下步骤:
[0024]对票据检测之后得到多个单张票据的掩码数据,根据设定的阈值对所述掩码数据进行过滤以获得符合条件的掩码数据;
[0025]将上述符合条件的掩码数据进行掩码合并之后,计算最小外包矩形,将得到的最小外包矩形位置使用数组方式进行切割。
[0026]实际操作的过程中,本专利技术混贴票据的识别切割方法按照如下步骤进行:
[0027]步骤1为添加边框。首先对输入图片添加一个纯色边框,得到待测的混贴票据图片,再进行下一步的票据检测。
[0028]步骤2为票据检测。对步骤1得到的混贴票据图像进行检测。本实施例主要采用MaskRCNN为基础网络结构,swin

transfomer为骨干网络进行混贴票据检测。
[0029]步骤3为掩码过滤。经过票据检测后会得到多个单张票据的掩码数据,根据事先设定好的阈值来对多个单张票据的掩码数据进行过滤,筛选出符合条件的掩码数据进行下一步的掩码合并。
[0030]步骤4为掩码合并。在此步骤中,模型识别得到的掩码数据可能存在断开的情况,
即一张票据的掩码被分成了多个部分,当出现该情况时需要对获得的多个掩码进行合并操作。将处理好的掩码进行下一步计算最小外包矩形。
[0031]步骤5为计算最小外包矩形。本专利技术使用findContours和minAreaRect来计算最小外包矩形。
[0032]步骤6为票据分类。根据票据检测的结果映射得到对应的票据分类结果。
[0033]步骤7为特征匹配。将相同类别的票据进行归类,分别计算每一类别内各个票据区域面积,并将面积进行从大到小排列。
[0034]步骤8为区域筛选。根据上一步骤得到的同一类别票据区域的面积,分别进行两两计算,计算两个区域的交集面积inter和面积更大的区域area的比值,当该比值小于Thr2时,认为两个区域是不同的票据,若比值大于Thr2,则认为两个区域同属于相同的一张票据,此时过滤掉面积更小的那块区域。最终将剩余的区域掩码输入到步骤5的计算过程中计算得到最小外包矩形。
[0035]步骤9为切割图片。根据步骤5得到的最小外包矩形位置,使用数组方式进行切割,最终输出切割后的票据图片,从而完成整个识别切割方法的实施。
[0036]上述过程中,之所以需要进行掩码合并,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种混贴票据的识别切割方法,其特征在于,包括如下步骤:对票据检测之后得到多个单张票据的掩码数据,根据设定的阈值对所述掩码数据进行过滤以获得符合条件的掩码数据;将上述符合条件的掩码数据进行掩码合并之后,计算最小外包矩形,将得到的最小外包矩形位置使用数组方式进行切割。2.根据权利要求1所述的识别切割方法,其特征在于,所述票据检测的方法包括:使用MaskRCNN为基础网络结构,swin

transfomer为骨干网络进行票据检测。3.根据权利要求2所述的识别切割方法,其特征在于,所述掩码合并的方法包括:对于分成了多个部分的掩码数据,将获得的多个掩码数据进行合并操作。4.根据权利要求2所述的识别切割方法,其特征在于,使用findContours和minAreaRect计算最小外包矩形。5.根据权利要求2所述的识别切割方法,其特征在于,计算最小外包矩形的方法包括:将所述票据检测后的结果映射得到对应的票据分类,然后将相同类别的票据进行归类,分别计算每一类别内各个票据的区域面积,并将形成的区域面积从大到小排列;将形成的多个区域面积进行区域筛选,所述区域筛选的标准为:每个区域面积对应有掩码合并操作之后形成的区域掩码,过滤掉误判的区域掩码。6.根据权利要求5所述的识别切割方法,其特征在于,所述区域筛选的方法...

【专利技术属性】
技术研发人员:杨剑翀
申请(专利权)人:金科览智科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1