发票关键信息定位方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：21606792 阅读：27 留言：0更新日期：2019-07-13 18:39

本发明专利技术涉及发票关键信息定位方法、装置、计算机设备及存储介质，该方法包括获取待定位发票图像；将待定位发票图像输入卷积神经网络模型中进行信息提取，以得到发票关键信息；其中，卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U‑Net卷积神经网络所得的。本发明专利技术通过获取待定位发票图像，将待定位发票图像输入至以U‑Net卷积神经网络为基础网络的卷积神经网络模型，利用卷积神经网络模型先对待定位发票图像进行分类别后，再定位至待定位发票图像的关键信息部分，并输出发票关键信息，实现快速地定位出发票关键信息，且定位准确率高。

Invoice Key Information Location Method, Device, Computer Equipment and Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
发票关键信息定位方法、装置、计算机设备及存储介质
本专利技术涉及文本检测方法，更具体地说是指发票关键信息定位方法、装置、计算机设备及存储介质。
技术介绍
增值税普通发票是将除商业零售以外的增值税一般纳税人纳入增值税防伪税控系统开具和管理，也就是说一般纳税人可以使用同一套增值税防伪税控系统开具增值税专用发票、增值税普通发票等。企业和社会，个人，政府等有越来越多的发票需要整理，越来越多的时间耗费在发票上，手动录入和人工检索，不仅浪费时间，而且容易出错。急需自动化的设备进行识别。现有文字识别系统多采用传统计算机视觉算法，未采用神经网络，准确率较低，大多需要配合扫描仪等设备进行扫描，在票据干净，整洁，而且很清晰时才能起到一定的识别效果，对自然场景下各种模糊的票据却大都无能为力。现有的大多数算法在现实中手机较为随意拍摄的任意角度真实数据上的效果不佳。尤其是当考虑到发票及其容易褶皱，褪色，且手机拍摄时面临多种光线和天气条件，多角度，多设备，透视等困难。现有两种关于文本信息定位的方法，一是借助扫描仪定位关键信息的位置，并经过传统的计算机视觉手段对位置进行微调，但是这种方法要依赖于专门的扫描仪，非常不方便。而且要求票据褶皱较少，没法应对实际中褶皱发票；二是要求用户根据指令将票据在画面预对齐、摆正，检测所有的文字行，对检测的所有文字送入识别系统进行识别，并用非常复杂的后处理手段去进行版面分析，分析识别到的信息到底是什么信息。通常，采用此种方式很难将票据上大量的信息点进行结构对齐，并且由于多检测了很多多余的信息，这些多余信息中的错误将意外的影响本身关注信息的提取和定位，且后续...

【技术保护点】
1.发票关键信息定位方法，其特征在于，包括：获取待定位发票图像；将待定位发票图像输入卷积神经网络模型中进行信息提取，以得到发票关键信息；其中，所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U‑Net卷积神经网络所得的。

【技术特征摘要】
1.发票关键信息定位方法，其特征在于，包括：获取待定位发票图像；将待定位发票图像输入卷积神经网络模型中进行信息提取，以得到发票关键信息；其中，所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的。2.根据权利要求1所述的发票关键信息定位方法，其特征在于，所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的，包括：获取带有特征标签的发票图像，以得到训练数据；构建U-Net卷积神经网络；利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习，以得到卷积神经网络模型。3.根据权利要求2所述的发票关键信息定位方法，其特征在于，所述利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习，以得到卷积神经网络模型，包括：将训练数据输入U-Net卷积神经网络内，以得到样本关键信息；根据样本关键信息计算损失值；根据损失值基于深度学习框架对U-Net卷积神经网络进行学习，以得到卷积神经网络模型。4.根据权利要求2所述的发票关键信息定位方法，其特征在于，所述U-Net卷积神经网络是产生多层的发票图像四分之一分辨率的特征图的网络。5.根据权利要求3所述的发票关键信息定位方法，其特征在于，所述将训练数据输入U-N...

【专利技术属性】
技术研发人员：张欢，李爱林，张仕洋，
申请(专利权)人：深圳市华付信息技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人