当前位置: 首页 > 专利查询>浙江大学专利>正文

多阶段数据生成自循环财务发票文本智能识别系统及方法技术方案

技术编号:23984961 阅读:71 留言:0更新日期:2020-04-29 13:05
本发明专利技术涉及财务发票文本识别技术领域,具体为一种多阶段数据生成自循环财务发票文本智能识别系统及方法。一种多阶段数据生成自循环财务发票文本智能识别系统,包括深度学习文本检测模块,用于通过标注过的财务发票图片训练深度学习目标检测模型以得到最终深度学习目标检测模型,用于通过所述最终深度学习目标检测模型获取待检测的财务发票图片的所有目标文本的位置信息,并根据所述位置信息截取对应的纯文本图片。本申请的系统首次应用了多阶段数据生成进行智能文本识别,并将基于深度学习的自循环文本识别训练过程应用在财务发票文本识别上,大大减少了财力人力和物力的消耗,提高了文本识别效率和准确率。

An intelligent text recognition system and method for multi-stage data generation and self circulation financial invoice

【技术实现步骤摘要】
多阶段数据生成自循环财务发票文本智能识别系统及方法
本专利技术涉及财务发票文本识别
,具体为一种多阶段数据生成自循环财务发票文本智能识别系统及方法。
技术介绍
近年来文本识别技术发展越来越成熟,文本识别应用场景也越来越复杂和多样化。这些文本场景中可能是汉字场景或英文场景,也可能是自然场景、工业和生活需求的票据、试卷等场景。各式各样的文本及其场景往往面对着数据差异大,数据分布不均等问题,在运用深度学习进行文本识别的过程中往往需要巨大的数据量对模型进行支撑。对合适数据的标注和寻找通常需要巨大的人力物力,非常费时费力且耗费资源。此外,现阶段的方法面对复杂难识别的文本场景,识别效果并不佳,尤其针对财务发票应用场景,对存在褶皱和污渍的发票样本,现阶段方法往往难以对其进行准确识别。针对这种现象,急需现有技术改进发展,解放数据标注需要的人力物力,并提升财务发票文本智能识别的准确率。
技术实现思路
本专利技术针对现有技术存在的问题,提出了一种多阶段数据生成自循环财务发票文本智能识别系统及方法。本专利技术解决其技术问题所采用的技本文档来自技高网...

【技术保护点】
1.多阶段数据生成自循环财务发票文本智能识别系统,其特征在于:包括/n深度学习文本检测模块,用于通过标注过的财务发票图片训练深度学习目标检测模型以得到最终深度学习目标检测模型,用于通过所述最终深度学习目标检测模型获取待检测的财务发票图片的所有目标文本的位置信息,并根据所述位置信息截取对应的纯文本图片;/n文本识别数据生成模块,用于获取文本场景特征,并通过数据生成控制器按照不同阶段生成深度学习文本识别模型所需的训练数据;/n深度学习文本识别模块,用于通过所述训练数据多阶段训练所述深度学习文本识别模型以得到最终深度学习文本识别模型,用于通过所述最终深度学习文本识别模型获取所述纯文本图片的文字信息。...

【技术特征摘要】
1.多阶段数据生成自循环财务发票文本智能识别系统,其特征在于:包括
深度学习文本检测模块,用于通过标注过的财务发票图片训练深度学习目标检测模型以得到最终深度学习目标检测模型,用于通过所述最终深度学习目标检测模型获取待检测的财务发票图片的所有目标文本的位置信息,并根据所述位置信息截取对应的纯文本图片;
文本识别数据生成模块,用于获取文本场景特征,并通过数据生成控制器按照不同阶段生成深度学习文本识别模型所需的训练数据;
深度学习文本识别模块,用于通过所述训练数据多阶段训练所述深度学习文本识别模型以得到最终深度学习文本识别模型,用于通过所述最终深度学习文本识别模型获取所述纯文本图片的文字信息。


2.根据权利要求1所述的多阶段数据生成自循环财务发票文本智能识别系统,其特征在于:所述深度学习文本检测模块包括
财务发票文本水平变换单元,通过霍夫变换检测财务发票图片中的财务发票文本中的直线,并根据所述直线将所述财务发票文本行旋转至水平位置以得到初始化财务发票图片;
财务发票图片标注单元,将用于训练的初始化财务发票图片进行手动标注以得到标注过的财务发票图片;
深度学习目标检测模型训练单元,通过所述标注过的财务发票图片训练深度学习目标检测模型以得到最终深度学习目标检测模型;
目标文本位置信息获取单元,通过所述最终深度学习目标检测模型获取待检测的初始化财务发票图片中的所有目标文本的位置信息;
纯文本图片截取单元,根据所述位置信息在所述待检测的初始化财务发票图片上截取对应的纯文本图片。


3.根据权利要求2所述的多阶段数据生成自循环财务发票文本智能识别系统,其特征在于:所述财务发票图片标注单元包括
标注工具子单元,用于根据标注类型框出所述初始化财务发票图片中对应的目标文本区域并存储相应的标注数据,所述标注数据包括所述标注类型对应的坐标信息;
检测工具子单元,用于根据所述标注数据在对应的所述初始化财务发票图片中显示对应的目标文本区域。


4.根据权利要求1所述的多阶段数据生成自循环财务发票文本智能识别系统,其特征在于:所述文本识别数据生成模块包括
文本场景特征获取单元,用于获取纯文本图片的文本场景特征;
数据生成控制器,由所述文本场景特征初始化并生成迁移控制参数、根据迁移控制参数对纯文本图片进行风格迁移和内容迁移以生成训练数据,并根据Loss收敛速度和测试集准确率增长率与期望值的差值阶段性更新迁移控制参数以生成不同阶段的训练数据直至Loss收敛速度和测试集准确率增长率与期望值的差值小于设定阈值。


5.根据权利要求4所述的多阶段数据生成自循环财务发票文本智能识别系统,其特征在于:所述数据生成控制器包括
样式迁移子单元,用于对纯文本图片进行字体渲染、边缘渲染、基础看色、投影变形、噪声和模糊处理。


6.根据权利要求1所述的多阶段数据生成自循环财务发票文本智能识别系统,其特征在于:所述深度学习文本识别模块包括
训练数据预处理单元,对所述训练数据进行预处理以得到预处理训练数据;
深度学习文本识别模型训练单元,通过所述预处理训练数据多阶段训练所述深度学习文本识别模型以得到最终深度学习文本识别模型;
Lo...

【专利技术属性】
技术研发人员:刘勇马新强王薇潘再生刘丽娜杨建党钟保权
申请(专利权)人:浙江大学浙江杰芯科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1