【技术实现步骤摘要】
发票专用章税号的提取和识别方法
本专利技术属于数字图像处理
,进一步涉及文字识别技术,具体为一种发票专用章税号的提取和识别方法,可用于获取税务登记号信息。
技术介绍
发票专用章是指使用发票的企业、单位和个体工商业户按税务机关规定刻制,在领购或开具发票时加盖于发票之上的专用印章,该印章印模里含有其公司单位名称、发票专用章字样及税务登记号,其中税务登记号简称税号。税号是发证机关给出的一张税务“身份证”,统一税号制度有利于强化税务登记,规范税收征管,加强纳税档案管理和税源管理,促进依法治税。因此税号的提取、识别显得尤为重要。现阶段税号的提取和识别方法主要有两种:一是传统的人工识别方法,其通过人工辨识税号,然后输入到计算机中,这种方法效率低、误差大,而且人工和时间成本过高;二是基于深度学习的提取和识别方法,通过大量已知训练样本训练分类器,然后采用循环神经网络对预处理后的图像数字进行定位,分割出带有数字的图像,最后将分割好的图像送到训练好的分类器中进行分类,该方法可以有效改善人工识别误差大、成本高的问题,然而其所采用的循环神经网络和分类器均需要提取图像的指定特征作为输入,因此计算量较大,依然存在提取和识别速度慢的不足。
技术实现思路
本专利技术的目的在于针对上述现有技术的不足,提出一种发票专用章税号的提取和识别方法,通过计算椭圆图像的质心,快速定位发票专用章中心坐标,进而选定税号所在区域,然后分割出单个数字图像,依次对其进行模板匹配,快速准确地识别发票专用章中的税号,从而提高对发票专用章税号的识别效率及精度。为实现上述目的,本专利技术采取的技术方案为:(1)获取包 ...
【技术保护点】
1.一种发票专用章税号的提取和识别方法,其特征在于,包括如下步骤:(1)获取包含发票专用章的RGB图像;(2)将获取的RGB图像进行拉普拉斯锐化,然后将其转换到YCrCb颜色空间;(3)将YCrCb颜色空间进行通道分离,并对分离出的Cr通道进行自适应阈值处理,将图像转换为二值图,再通过膨胀腐蚀运算去除二值图的噪声,得到仅包含发票专用章的二值图;(4)对仅包含发票专用章的二值图进行Canny边缘检测,选出最外层轮廓,即发票专用章的外轮廓椭圆图像;(5)计算外轮廓椭圆图像的质心坐标,即发票专用章的中心点坐标;(6)根据中心点坐标截取只包含税号的矩形区域;(7)将矩形区域中的税号分割为单个数字;(8)制作数字0~9的搜索模板T,调整单个数字图像的大小,使其与搜索模板T中数字的大小一致,将调整后的单个数字作为被搜索图S依次送入制作好的数字搜索模板中,采用相关法对数字进行匹配,根据匹配结果识别税号。
【技术特征摘要】
1.一种发票专用章税号的提取和识别方法,其特征在于,包括如下步骤:(1)获取包含发票专用章的RGB图像;(2)将获取的RGB图像进行拉普拉斯锐化,然后将其转换到YCrCb颜色空间;(3)将YCrCb颜色空间进行通道分离,并对分离出的Cr通道进行自适应阈值处理,将图像转换为二值图,再通过膨胀腐蚀运算去除二值图的噪声,得到仅包含发票专用章的二值图;(4)对仅包含发票专用章的二值图进行Canny边缘检测,选出最外层轮廓,即发票专用章的外轮廓椭圆图像;(5)计算外轮廓椭圆图像的质心坐标,即发票专用章的中心点坐标;(6)根据中心点坐标截取只包含税号的矩形区域;(7)将矩形区域中的税号分割为单个数字;(8)制作数字0~9的搜索模板T,调整单个数字图像的大小,使其与搜索模板T中数字的大小一致,将调整后的单个数字作为被搜索图S依次送入制作好的数字搜索模板中,采用相关法对数字进行匹配,根据匹配结果识别税号。2.根据权利要求1所述的方法,其特征在于:步骤(2)中对获取的RGB图像进行拉普拉斯锐化处理,具体处理方式为:将低于邻域像素平均灰度值的中心像素灰度值降低,将高于邻域像素平均灰度值的中心像素灰度值提高。3.根据权利要求1所述的方法,其特征在于:步骤(2)中将锐化后的RGB图像通过如下公式转换到YCrCb颜色空间:Y=(B×1868+G×9617+R×4899+8192)÷16384;Cr=((B-Y)×9241+8192)÷16384+128;Cb=((R-Y)×11682+8192)÷16384+128;其中,“Y”表示YCrCb图像中Y通道的值,“Cr”表示YCrCb图像中Cr通道的值,“Cb”表示YCrCb图像中Cb通道的值,“R”表示RGB图像中R通道的值,“G”表示RGB图像中G通道的值,“B”表示RGB图像中B通道的值。4.根据权利要求1所述的方法,其特征在于:步骤(4)中对仅包含发票专用章的二值图进行Canny边缘检测,具体通过以下步骤实现:(4.1)利用高斯滤波器对二值图进行去噪;(4.2)计算去噪后图像中每个像素点的梯度强度和方向;(4.3)采用非极大值抑制的方式消除边缘检测带来的杂散响应;(4.4)使用双阈值检测确定真实的以及潜在的边缘;(4.5)通过抑制孤...
【专利技术属性】
技术研发人员:张文博,王凯,姬红兵,李林,臧博,
申请(专利权)人:西安电子科技大学昆山创新研究院,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。