【技术实现步骤摘要】
一种发票图像信息识别方法、装置及存储介质
[0001]本专利技术涉及发票识别领域,尤其涉及一种发票图像信息识别方法、装置及存储介质。
技术介绍
[0002]近年来,随着营改增等税制改革与税法的落地应用深入推进,政府监管力度不断加大,监管水平快速提升,监管手段不断丰富,我国发票的使用量剧增,其中增值税专用发票和增值税普通发票使用量占比极大,约占各类发票总量的90%。现阶段发票的报销流程仍十分繁琐,各个企业、事业单位等机构的财务报销还是主要由财务部门相关人员或业务部门人员进行手动录入,人力成本高,占用大量时间,月末、年末集中处理时,易出现信息录入错误、信息准确性不足等现象。
[0003]目前,传统算法可以对扫描的增值税专用发票和增值税普通发票图像进行信息的识别,但对手机拍摄的缩放比、模糊程度、亮度、倾斜角度、尺寸以及背景干扰各不相同的自然场景下的发票图像中的信息进行识别还存在挑战,若需要智能定位发票中的关键信息,传统的模板匹配算法以及锚点定位方法不具有普适性。文本检测识别是计算机视觉技术的一个重要的应用领域,利用文本识别 ...
【技术保护点】
【技术特征摘要】
1.一种发票图像信息识别方法,其特征在于,包括:采集发票图像并对所采集的发票图像进行预处理,预处理后的图像输入到经演化算法优化的残差神经网络识别发票中的待识别区域;所述残差神经网络包括第一卷积层、连接第一卷积层的第一池化层,连接第一池化层的第二卷积层连接第二卷积层的第二池化层,连接第二池化层的第一残差块,连接第一残差块的第二残差块,连接第二残差块的第三卷积层,连接第三卷积层的第三池化层,连接第三池化层的第三残差块,第三残差块连接全局平均池化层,全局平均池化层连接基于多目标优化的深度森林分类器;对各个待识别区域内相关的数字信息进行识别,将识别的信息进行格式化的存储。2.根据权利要求1所述的发票图像信息识别方法,其特征在于,所述预处理包括对发票图像进行仿射变换以达到预设尺寸,对发票图像进行透视变换以纠正发票图像待识别区域的透视变形,对发票图像进行边缘检测以提取图像的有效信息。3.根据权利要求1所述的发票图像信息识别方法,其特征在于,所述第一残差块、第二残差块和第三残差块的结构相同包括输入层,所述输入层一方面连接内部卷积层,内部卷积层的输出一方面连接阈值筛选层,内部卷积层的输出另一方面连接全局卷积层,全局卷积层的输出连接批归一化层、ReLU激活函数层和Sigmoid激活函数层,内部卷积层的输出另一方面与Sigmoid激活函数层的输出加权后输入到阈值筛选层,所述输入层另一方面与阈值筛选层的输出加权后输出。4.根据权利要求1所述的发票图像信息识别方法,其特征在于,所述深度森林分类器采用级联森林结构,级联森林结构的每一层森林为决策树集成,每一层森林产生的特征向量将与原始特征向量连接并输入到下一级森林中,直至倒数第二层,取深度森林分类模型中最后一层森林的结果的平均值中的最大值作为深度森林分类器输出的分类结果。5.根据权利要求4所述的发票图像信息识别方法,其特征在于,根据深度森林分类器的级联层数的增加对深度森林分类器性能改善自动确定级联层数包括:每个森林通过k折交叉验证生成类向量,即每个样本数据作为k
‑
1次的训练样本,产生k
‑
1个类向量,并根据图像得到验证数据,当拓展产生新的一层森林时,根据验证数据对整个深度森林分类器的性能进行评估,如果整个深度森林分类器的性能没有明显改善,则森林的层数不再增加。6.根据权利要求4所述的发票图像信息识别方法,其特征在于,级联森林结构每层包含随机森林和完全随机森林;随机森林的决策树构建时在整个特征空间中随机选择个特征作为候选特征,其中,d为输入特征的个数,然后选择具有最佳...
【专利技术属性】
技术研发人员:张文洋,杨桂珍,尹旭,褚夕,杨寅,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。