The invention discloses a method for identifying VAT invoices based on image processing. The method comprises three parts: delimiting the text box of each item of VAT invoices, identifying the text information in the box and checking the invoice amount. Specific steps: (1) Preprocessing, geometric correction; (2) the collection of images into a unified standard size; (3) the VAT invoice picture is divided into eight text area pictures; (4) the text area pictures are divided into their own text box; (5) each text box input OCR software to identify text information; (6) check the invoice amount. The invention can greatly improve the efficiency of VAT reimbursement, and ensure the accuracy, avoid the staff delaying normal work due to long reimbursement time, and play a certain role in promoting the operation of enterprises with low cost and high efficiency in the future.
【技术实现步骤摘要】
一种基于图像处理的增值税发票识别方法
本专利技术涉及一种基于图像处理的增值税发票识别方法,属于电子
技术介绍
随着网络技术,特别是互联网技术在我国的迅速推广和普及,各种网络应用,如网上支付、电子商务、网络办公也在我国迅速发展,大大的方便了企业职员工作。然而,发票报销效率低的问题仍亟待解决。社会经济不断发展,发票报销的工作越来越受到重视,目前的发票报销是采用人工报销的方式,基本全依赖于财务报销人员的业务能力。财务报销人员的工作效率直接影响待报销员工在报销上的用时。发票报销成为加快企业发展的绊脚石,而增值税发票报销是发票报销中重要的一部分。现有的互联网和人工智能技术很少运用到发票报销上,针对增值税发票智能报销的系统尚未有相关专利进行披露。OCR光学字符识别技术:OCR文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。先对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
技术实现思路
本专利技术提供一种基于图像处理的增值税发票识别方法,解决如何核对OCR识别出的金额是否正确、发票金额是最重要的内容、发票上有货物数量、单价、金额、税率、税额以及价税合计的大小写、要核对各项金额是否正确的技术问题。本专利技术为解决上述技术问题采用以下技术方案:本专利技术提供一种基于图像处理的增值税发票识别方法,包括以下步骤:步骤1,采集发票图像并进行预处理以及几何校正;步骤2,将步骤1中校正后的图像处理成标准尺寸;步骤3,将步骤2处理后的图像分割出八个文本区域;步骤4,从步骤3中的八个文本区域 ...
【技术保护点】
1.一种基于图像处理的增值税发票识别方法,其特征在于,包括以下步骤:步骤1,采集发票图像并进行预处理以及几何校正;步骤2,将步骤1中校正后的图像处理成标准尺寸;步骤3,将步骤2处理后的图像分割出八个文本区域;步骤4,从步骤3中的八个文本区域中,分别分割出其中的文本框;步骤5,将步骤4中的每个文本框分别输入OCR软件进行识别,得到其中的文字信息;步骤6,根据步骤5中识别的信息,核对发票金额。
【技术特征摘要】
1.一种基于图像处理的增值税发票识别方法,其特征在于,包括以下步骤:步骤1,采集发票图像并进行预处理以及几何校正;步骤2,将步骤1中校正后的图像处理成标准尺寸;步骤3,将步骤2处理后的图像分割出八个文本区域;步骤4,从步骤3中的八个文本区域中,分别分割出其中的文本框;步骤5,将步骤4中的每个文本框分别输入OCR软件进行识别,得到其中的文字信息;步骤6,根据步骤5中识别的信息,核对发票金额。2.根据权利要求1所述的一种基于图像处理的增值税发票识别方法,其特征在于,所述预处理为:首先,对采集发票图像进行灰度处理,然后,通过霍夫变换算法提取发票图像的外边框,最后,裁剪掉图像外边框以外的部分。3.根据权利要求2所述的一种基于图像处理的增值税发票识别方法,其特征在于,根据提取的外边框使用Hough变换检测出发票图像的倾斜角,并根据进行几何校正。4.根据权利要求3所述的一种基于图像处理的增值税发票识别方法,其特征在于,使用Hough变换检测出发票图像的倾斜角,具体为:步骤A,在直角坐标系下将校正后的发票图像C离散化,并计算出图像C的长m和宽n;步骤B,建立离散化的参数空间ρ-θ,并将其初始化,建立二维累加数组K(θ,ρ),其中,θ∈[0,180],步骤C,遍历步骤A中离散化的图像C,找出所有像素值不为0的点,对找出的每个点,将其坐标(x,y)带入方程ρ=xcosθ+ysinθ中,并以1为步长遍历θ∈[0,180],求出每个θi所对应的ρi,在相应的二维累加数组K(θi,ρi)上加1,其中,θi为第i次...
【专利技术属性】
技术研发人员:桂冠,尹悦,熊健,杨洁,范山岗,张海军,
申请(专利权)人:南京邮电大学,江苏皓盘软件科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。