一种增值税发票的识别方法技术

技术编号:15692139 阅读:44 留言:0更新日期:2017-06-24 05:55
本发明专利技术提供一种增值税发票的识别方法,其特征在于,包括如下步骤:对输入的发票图像进行预处理;对发票图像进行选项区域定位;字符分割;字符区域分为9块;提取每个图像块的HOG特征,得到9个一维的HOG特征序列;特征序列分别与模板做比对,得到差异系数;根据差异系数的大小,为这9块赋予不同权重,生成权重矩阵;将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;对每个切分后的字符重复上述步骤直至完成发票各项内容的识别。本发明专利技术有效地实现对增值税发票中的汉字模块识别,同时对形近字区分能力增强,具有光照不变性和旋转不变性,抗干扰能力更强,对模糊字符有着较好的识别能力。

Recognition method of value-added tax invoice

The present invention provides a method to identify the VAT invoice, is characterized by comprising the following steps: Invoice image preprocessing; option to locate the region of invoice image; character segmentation; character region is divided into 9 blocks; each HOG feature extraction of image blocks, obtained HOG sequences of 9 dimensional; the characteristics of sequence respectively compared with the template, get the difference coefficient; according to the difference of the size of the coefficients for the 9 pieces of different weight, weight and weight matrix generation; difference coefficient weighted sum, the candidate character difference score, calculating each candidate character difference score, minimum value corresponds to the character matching results of recognition; each segment the character after repeating the above steps until the completion of the contents of the invoice. The invention effectively realize the Chinese characters module identification of VAT invoices in at the same time, nearly word distinguishing ability enhancement, with illumination invariance and rotation invariance, stronger anti-interference ability, has a better recognition ability of fuzzy character.

【技术实现步骤摘要】
一种增值税发票的识别方法
本专利技术涉及一种增值税发票的识别方法,特别是针对形近字有着较高的辨别能力。
技术介绍
现有技术中,对于增值税发票识别,通常采用如下方式:通过表格模板定制,设置识别区域,识别属性,调用专用的字符,进行选项区域识别,根据识别属性进行识别后处理,最后输出结构化的识别结果;或者在使用清华TH-OCR技术的基础上,对发票进行多项预处理操作,具体有纠偏、偏色校正、滤色、降噪、二值化、增强识别单元对比度等功能,这些功能可灵活配置、自由组合,为之后识别输出最优的图像质量。目前,对于增值税发票识别存在以下问题:1、目前增值税发票识别中通常只识别数字,缺少对增值税发票中汉字的识别模块;2、对于形近字的区分能力相对较弱,容易出现误识的情况;3、增值税发票纸质为复写纸,打印时字符笔画容易粘连,造成识别困难。
技术实现思路
根据上述提出的技术问题,而提供一种增值税发票的识别方法。本专利技术主要利用通过对输入图像的预处理、票据选项定位、字符分割、字符区域分块、提取HOG特征、对比识别、块权重分配到输出核对,对增值税发票进行识别,从而有效的实现对增值税发票中的汉字模块识别,同时对形近字区分能力增强。本专利技术采用的技术手段如下:一种增值税发票的识别方法,其特征在于,包括如下步骤:S1、对输入的发票图像进行预处理:提取原始彩色发票图像的r分量,作为灰度图像,对灰度图像进行中值滤波操作,减少噪点,对灰度图像进行Radon变换,进行倾斜校正;S2、对发票图像进行选项区域定位:寻找标记点,进行选项区域定位,截取各选项区域,分别二值化处理得到黑底白字图像;S3、字符分割:将各选项区域的字符通过投影法分割开来,得到单个字符的最小外接矩形,便于后续的识别处理;S4、字符区域分块:将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块;S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列;S6、将步骤S5中的特征序列分别与模板做比对,比对公式如下:其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值;r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关;其差异系数d用1-r来表示;S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵,其权重分配方式如下:S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;S9、对每个切分后的字符重复上述步骤S4至S8,直至完成发票各项内容的识别。进一步地,所述步骤S2中,具体包括:S21、寻找标记点,将发票矩形框的四个顶点定位,取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影;投影值第一个和最后一个向下尖峰处,即为矩形顶点位置,从而确定矩形框的位置;S22、进行选项区域定位,发票各选项区域位置是固定的,根据矩形框位置,与发票各选项区域的相对位置关系,将各区域坐标计算出来;S23、用S22中计算出的坐标,在步骤S1处理完的灰度图像上,截取各选项区域,并分别二值化处理,得到黑底白字的二值图像。进一步地,所述步骤S3中,字符通过投影法分割具体为,分别获取各字符的左右边界,进行垂直分割;再将分割出的每个块,进行水平投影,去除零点,即字符上方和下方多余部分;保留非零点,即字符。进一步地,根据不同区域内容不同,具体的切分方式也相应不同:①只有一行字的情况:先垂直投影,再从左向右水平扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为字符左边界,遍历所有点,得到所有字符的左边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为字符右边界,遍历所有点,得到所有字符右边界,使用这些边界信息,进行垂直分割;②有多行文字的情况:首先进行水平分割,将多行字分割成多个单行字,这样后面的步骤同①一样,水平分割做法:先水平投影,再从上往下扫描,若当前点像素值为零,前面有连续若干个点像素值为零,后面连续若干个点像素值非零,则认为该点为行的上边界,遍历所有点,得到所有行的上边界;若当前点像素值非零,前面有连续若干个点像素值非零,后面有连续若干个点像素值为零,则认为该点为行的边界,遍历所有点,得到所有行的下边界,使用这些边界信息,将图像分割为单行字,再重复步骤①,将单行字分割成单个字符。进一步地,所述步骤S6中,其比对过程为:S61、读取一个待识别字符,从左至右,从上之下,从第1块开始进行模板匹配,然后依次对第2、3、4块,直至第9块进行匹配;S62、当前模板9块匹配结束,读取下一个模板,重复步骤S61,直至所有模板相似度计算完毕;S63、设定相似度阈值T,统计每个模板字符的9块相似度,若相似度小于该阈值的块数大于等于6,则该模板字符必定不是正确结果,不进行操作;若小于6块,则将该模板存入候选字符。本专利技术具有以下优点:1、本专利技术不仅对增值税发票中的数字部分进行识别,如买方税号、售方税号等,还对发票中的汉字进行了识别,如买方名称、售方名称等;2、本专利技术考虑到汉字的结构特点,将字符划分为9宫格,并提出“差异越大,权重越大”的加权求和思想,对形近字有良好的区分度;3、本专利技术具有光照不变性和旋转不变性,抗干扰能力更强,对模糊字符有着较好的识别能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术识别方法的流程框图。图2为本专利技术对发票图像进行处理示意图,其中,a为倾斜图像,b为倾斜校正后的图像。图3为本专利技术票据选项定位时寻找标记点的示意图。图4为本专利技术字符区域分块后得到的图像块示意图。图5为图3寻找标记点后分别进行水平投影和垂直投影的图像。图6为本专利技术字符比对与识别过程流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,一种增值税发票的识别方法,包括如下步骤:S1、对输入的发票图像进行预处理,其包括以下步骤:提取原始彩色发票图像的r分量,作为灰度图像;灰度图像进行中值滤波操作,减少噪点;对灰度图像进行Radon变换,进行倾斜校正,其结果如图2所示。S2、对发票图像进行选项区域定位。其包括以下步骤:S21、寻找标记点,如图3所示,将发票矩形框的四个顶点定位,具体做法是:取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影。如图5所示,投影值第一个和最后一个向下尖峰处,即为矩形顶点位置。这样便可确定矩形框的位置;S22、进行选项本文档来自技高网...
一种增值税发票的识别方法

【技术保护点】
一种增值税发票的识别方法,其特征在于,包括如下步骤:S1、对输入的发票图像进行预处理:提取原始彩色发票图像的r分量,作为灰度图像,对灰度图像进行中值滤波操作,减少噪点,对灰度图像进行Radon变换,进行倾斜校正;S2、对发票图像进行选项区域定位:寻找标记点,进行选项区域定位,截取各选项区域,分别二值化处理得到黑底白字图像;S3、字符分割:将各选项区域的字符通过投影法分割开来,得到单个字符的最小外接矩形,便于后续的识别处理;S4、字符区域分块:将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块;S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列;S6、将步骤S5中的特征序列分别与模板做比对,比对公式如下:

【技术特征摘要】
1.一种增值税发票的识别方法,其特征在于,包括如下步骤:S1、对输入的发票图像进行预处理:提取原始彩色发票图像的r分量,作为灰度图像,对灰度图像进行中值滤波操作,减少噪点,对灰度图像进行Radon变换,进行倾斜校正;S2、对发票图像进行选项区域定位:寻找标记点,进行选项区域定位,截取各选项区域,分别二值化处理得到黑底白字图像;S3、字符分割:将各选项区域的字符通过投影法分割开来,得到单个字符的最小外接矩形,便于后续的识别处理;S4、字符区域分块:将分割好的字符,进行尺度变换,变为正方形,然后将字符图像的高和宽等间距各分3份,得到9个正方形的图像块;S5、提取每个图像块的HOG特征,得到9个一维的HOG特征序列;S6、将步骤S5中的特征序列分别与模板做比对,比对公式如下:其中,An为待识别字符块的HOG特征序列,为An的均值;Bn为模板字符块HOG特征序列,为Bn的均值;r为待识别字符块与模板字符块的相关系数,当-1≤r<0时,An与Bn为负相关;当0<r≤1时,An与Bn为正相关;当r=0时,An与Bn不相关;其差异系数d用1-r来表示;S7、将候选字符中的9个块,进行加权求和,根据差异系数d的取值范围,为其赋予不同权重,生成权重矩阵,其权重分配方式如下:S8、将权重与差异系数加权求和,得到候选字符差异得分,计算每个候选字符差异得分,取最小值对应字符为匹配结果;S9、对每个切分后的字符重复上述步骤S4至S8,直至完成发票各项内容的识别。2.根据权利要求1所述的增值税发票的识别方法,其特征在于,所述步骤S2中,具体包括:S21、寻找标记点,将发票矩形框的四个顶点定位,取原始彩色发票图像的b分量图像,将其二值化,并分别水平、垂直投影;投影值第一个和最后一个向下尖峰...

【专利技术属性】
技术研发人员:王新年廖玉钦王慧玉
申请(专利权)人:大连海事大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1