本发明专利技术公开了一种基于卷积神经网络的机场工作单信息识别方法及识别系统,包括一,采集未填写信息的工作单图像,得到表格区模板和非表格区域模板;二,对表格区模板进行处理,获取其表格框线;三,对非表格区域模板进行人为框选,作为工作单的非表格有效区域的切分信息;四,对表格模板和工作单非表格有效区域模板进行切分效果检验,并对切分结果进行索引标注,建立数据字段与单元格区域的索引关系;五,采集待识别工作单图片,并对待识别手写工作单进行透视矫正和重新截取;六,对工作单图像进行完整性判别;七,进行非手写信息消除;八,取出与数据字段对应的图片块;通过卷积神经网络对其进行识别,并根据索引信息组装表格信息字典存入数据库。典存入数据库。典存入数据库。
【技术实现步骤摘要】
基于卷积神经网络的机场工作单信息识别方法及系统
[0001]本专利技术属于图像处理
,特别是涉及一种基于卷积神经网络的机场工作单信息识别方法及系统。
技术介绍
[0002]随着大数据时代的来临,纸质档案数量的逐年递增,在数以万计的传统档案库中想要准确而迅速地找出自己所需要的档案简直像大海捞针,而在科学与新技术更替日新月异的时期,档案数字化的建设也亟待更为广泛地推广。传统的档案信息一般还是以纸质文档为主,放置在档案室里面,查找调用起来非常费时。而数字档案在对原档案文件进行扫描和识别以后,可以迅速方便地把信息录入到计算机数据库中,用网络存储档案信息,检索快捷方便,实时同步备份,存储空间小,维护方便安全,还能借助计算机的网络化特点从而更为便利地为全单位、区域、全国甚至全世界所利用。处在网络信息化社会的档案事业,也将朝着多元化、先进化、开放化的方向发展,档案数字化建设乃是大势所趋。同时,对民航领域的纸质档案进行数字化也是推进民航信息化发展的一项重任。
技术实现思路
[0003]技术问题
[0004]本专利技术为解决机场运营中地面服务工作单存档后不便检索而提供一种基于卷积神经网络的机场工作单信息识别方法及识别系统;本专利技术可以的机坪现场工作单进行自动识别和结构化存储,大大减少了检索难度,提高了检索效率。
[0005]技术方案
[0006]本专利技术的第一目的是提供一种基于卷积神经网络的机场工作单信息识别方法,包括如下步骤:
[0007]S1,通过摄像头或扫描仪采集未填写信息的工作单图像,通过图像矫正和重新截取,得到工作单的表格区模板和非表格区域模板,并记录下截取参数;
[0008]S2,对工作单的表格区模板进行处理,获取其表格框线;并对提取的表格框线进行人为校正得到完整表格框线,对完整表格框线进行识别得到完整表格结构信息,通过信息将表格图片按单元格进行切分得到切分信息;
[0009]S3,对工作单的非表格区域模板的部分进行人为框选,作为工作单的非表格有效区域的切分信息;
[0010]S4,使用S2、S3得到的切分信息对工作单表格模板和工作单非表格有效区域模板进行切分效果检验,并对切分结果进行索引标注,建立数据字段与单元格区域的索引关系;
[0011]S5,通过扫描仪或摄像头采集待识别工作单图片传入Jetson Nano嵌入式设备,并对待识别手写工作单进行透视矫正和重新截取,得到工作单表格图像和工作单非表格有效区域图像;
[0012]S6,设计判别规则,对提取到的工作单图像进行完整性判别,若判别出表格不完
整,则给出提示信息,对该工作单进行重新识别;
[0013]S7,对S5得到的工作单表格图像和工作单非表格有效区域,根据模板图片及一些先验规则进行非手写信息消除;再根据S2、S3得到的切分信息进行切分,并根据S4得到的索引关系建立字段和手写信息的映射关系;
[0014]S8,根据映射关系逐一取出与数据字段对应的含单个手写元素的图片块;并通过卷积神经网络对其进行识别,并根据索引信息组装表格信息字典存入数据库。
[0015]优选地,S1中,通过透视变换对采集到的图像进行图像矫正,具体为:透视变换通过将表格区域的位置恢复从而得到透视变换矩阵及透视变换后新的表格区域,根据该区域对透视变换后的图像进行截取得到表格区域模板,同时,工作单的非表格区域与表格区域存在一定位置和比例关系,通过该关系完成对工作单的非表格区域进行模板提取。
[0016]本专利技术的第二目的是提供一种基于卷积神经网络的机场工作单信息识别系统,包括:
[0017]图像采集部;
[0018]获取图像采集部的数据,并对数据进行处理的信息处理部;其中:
[0019]通过图像采集部采集未填写信息的工作单图像并发送给信息处理部,信息处理部通过图像矫正和重新截取,得到工作单的表格区模板和非表格区域模板,并记录下截取参数;
[0020]信息处理部对工作单的表格区模板进行处理,获取其表格框线;并对提取的表格框线进行人为校正得到完整表格框线,对完整表格框线进行识别得到完整表格结构信息,通过信息将表格图片按单元格进行切分得到切分信息;
[0021]通过信息处理部对工作单的非表格区域模板的部分进行人为框选,作为工作单的非表格有效区域的切分信息;
[0022]信息处理部使用上述切分信息对工作单表格模板和工作单非表格有效区域模板进行切分效果检验,并对切分结果进行索引标注,建立数据字段与单元格区域的索引关系;
[0023]通过图像采集部采集待识别工作单图片传入Jetson Nano嵌入式设备,并对待识别手写工作单进行透视矫正和重新截取,得到工作单表格图像和工作单非表格有效区域图像;
[0024]通过信息处理部设计判别规则,对提取到的工作单图像进行完整性判别,若判别出表格不完整,则给出提示信息,对该工作单进行重新识别;
[0025]通过信息处理部对上述工作单表格图像和工作单非表格有效区域,根据模板图片及一些先验规则进行非手写信息消除;再根据上述切分信息进行切分,并根据上述索引关系建立字段和手写信息的映射关系;
[0026]信息处理部根据映射关系逐一取出与数据字段对应的含单个手写元素的图片块;并通过卷积神经网络对其进行识别,并根据索引信息组装表格信息字典存入数据库。
[0027]优选地,所述图像采集部包括摄像头或扫描仪。
[0028]本专利的第三专利技术目的是提供一种实现上述基于卷积神经网络的机场工作单信息识别方法的计算机程序。
[0029]本专利的第四专利技术目的是提供一种实现上述基于卷积神经网络的机场工作单信息识别方法的信息数据处理终端。
[0030]本专利的第五专利技术目的是提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述的基于卷积神经网络的机场工作单信息识别方法。
[0031]本专利技术的优点及积极效果为:
[0032]通过采用上述技术方案,本专利技术具有如下的技术效果:
[0033]本专利技术通过卷积神经网络对机坪现场手写工作工作单的手写的信息进行识别并进行结构化存储以方便对其进行检索。通过图像批量采集装置进行采集并识别识别,并搭建数据存储中心存储识别后的信息。对采集到的图片使用形态学知识以及与空白工作单的关系可以完成对非手写信息的剔除,并可以通过形态学变换以及人工的辅助完成手写信息的分割,再通过对分割后的与单个字段对应的手写信息进行识别后即可对该工作单的手写信息进行结构化存储。从而减少了对工作单进行归档和检索的难度。
附图说明
[0034]图1为本专利技术优先实施例的流程图;
[0035]图2为空白工作单图;
[0036]图3为待识别工作单图;
[0037]图4为待识别工作单图像表格区手写信息图;
[0038]图5为待识别工作单图像非表格区手写信息图;
[0039]图6为图3中单个手写信息区识别效果示意图。
具本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于卷积神经网络的机场工作单信息识别方法,其特征在于,包括如下步骤:S1,通过摄像头或扫描仪采集未填写信息的工作单图像,通过图像矫正和重新截取,得到工作单的表格区模板和非表格区域模板,并记录下截取参数;S2,对工作单的表格区模板进行处理,获取其表格框线;并对提取的表格框线进行人为校正得到完整表格框线,对完整表格框线进行识别得到完整表格结构信息,通过信息将表格图片按单元格进行切分得到切分信息;S3,对工作单的非表格区域模板的部分进行人为框选,作为工作单的非表格有效区域的切分信息;S4,使用S2、S3得到的切分信息对工作单表格模板和工作单非表格有效区域模板进行切分效果检验,并对切分结果进行索引标注,建立数据字段与单元格区域的索引关系;S5,通过扫描仪或摄像头采集待识别工作单图片传入Jetson Nano嵌入式设备,并对待识别手写工作单进行透视矫正和重新截取,得到工作单表格图像和工作单非表格有效区域图像;S6,设计判别规则,对提取到的工作单图像进行完整性判别,若判别出表格不完整,则给出提示信息,对该工作单进行重新识别;S7,对S5得到的工作单表格图像和工作单非表格有效区域,根据模板图片及一些先验规则进行非手写信息消除;再根据S2、S3得到的切分信息进行切分,并根据S4得到的索引关系建立字段和手写信息的映射关系;S8,根据映射关系逐一取出与数据字段对应的含单个手写元素的图片块;并通过卷积神经网络对其进行识别,并根据索引信息组装表格信息字典存入数据库。2.根据权利要求1所述的基于卷积神经网络的机场工作单信息识别方法,其特征在于,S1中,通过透视变换对采集到的图像进行图像矫正,具体为:透视变换通过将表格区域的位置恢复从而得到透视变换矩阵及透视变换后新的表格区域,根据该区域对透视变换后的图像进行截取得到表格区域模板,同时,工作单的非表格区域与表格区域存在一定位置和比例关系,通过该关系完成对工作单的非表格区域进行模板提取。3.一种基于卷积神经网络的机场工作单信息识别系统,其特征在于,包括:图像采...
【专利技术属性】
技术研发人员:吕宗磊,罗佳,
申请(专利权)人:中国民航大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。