【技术实现步骤摘要】
基于卷积神经网络的机场工作单信息识别方法及系统
[0001]本专利技术属于图像处理
,特别是涉及一种基于卷积神经网络的机场工作单信息识别方法及系统。
技术介绍
[0002]随着大数据时代的来临,纸质档案数量的逐年递增,在数以万计的传统档案库中想要准确而迅速地找出自己所需要的档案简直像大海捞针,而在科学与新技术更替日新月异的时期,档案数字化的建设也亟待更为广泛地推广。传统的档案信息一般还是以纸质文档为主,放置在档案室里面,查找调用起来非常费时。而数字档案在对原档案文件进行扫描和识别以后,可以迅速方便地把信息录入到计算机数据库中,用网络存储档案信息,检索快捷方便,实时同步备份,存储空间小,维护方便安全,还能借助计算机的网络化特点从而更为便利地为全单位、区域、全国甚至全世界所利用。处在网络信息化社会的档案事业,也将朝着多元化、先进化、开放化的方向发展,档案数字化建设乃是大势所趋。同时,对民航领域的纸质档案进行数字化也是推进民航信息化发展的一项重任。
技术实现思路
[0003]技术问题
[0004]本专 ...
【技术保护点】
【技术特征摘要】
1.一种基于卷积神经网络的机场工作单信息识别方法,其特征在于,包括如下步骤:S1,通过摄像头或扫描仪采集未填写信息的工作单图像,通过图像矫正和重新截取,得到工作单的表格区模板和非表格区域模板,并记录下截取参数;S2,对工作单的表格区模板进行处理,获取其表格框线;并对提取的表格框线进行人为校正得到完整表格框线,对完整表格框线进行识别得到完整表格结构信息,通过信息将表格图片按单元格进行切分得到切分信息;S3,对工作单的非表格区域模板的部分进行人为框选,作为工作单的非表格有效区域的切分信息;S4,使用S2、S3得到的切分信息对工作单表格模板和工作单非表格有效区域模板进行切分效果检验,并对切分结果进行索引标注,建立数据字段与单元格区域的索引关系;S5,通过扫描仪或摄像头采集待识别工作单图片传入Jetson Nano嵌入式设备,并对待识别手写工作单进行透视矫正和重新截取,得到工作单表格图像和工作单非表格有效区域图像;S6,设计判别规则,对提取到的工作单图像进行完整性判别,若判别出表格不完整,则给出提示信息,对该工作单进行重新识别;S7,对S5得到的工作单表格图像和工作单非表格有效区域,根据模板图片及一些先验规则进行非手写信息消除;再根据S2、S3得到的切分信息进行切分,并根据S4得到的索引关系建立字段和手写信息的映射关系;S8,根据映射关系逐一取出与数据字段对应的含单个手写元素的图片块;并通过卷积神经网络对其进行识别,并根据索引信息组装表格信息字典存入数据库。2.根据权利要求1所述的基于卷积神经网络的机场工作单信息识别方法,其特征在于,S1中,通过透视变换对采集到的图像进行图像矫正,具体为:透视变换通过将表格区域的位置恢复从而得到透视变换矩阵及透视变换后新的表格区域,根据该区域对透视变换后的图像进行截取得到表格区域模板,同时,工作单的非表格区域与表格区域存在一定位置和比例关系,通过该关系完成对工作单的非表格区域进行模板提取。3.一种基于卷积神经网络的机场工作单信息识别系统,其特征在于,包括:图像采...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。