一种基于深度学习的航运单识别方法技术

技术编号:28141306 阅读:20 留言:0更新日期:2021-04-21 19:18
本发明专利技术提供了航运单识别技术领域的一种基于深度学习的航运单识别方法,包括:步骤S10、获取航运单图片并进行标注,生成标注数据集;步骤S20、创建航运单类型识别模型以及文字定位识别模型,利用标注数据集分别对两个识别模型进行训练;步骤S30、利用训练后的航运单类型识别模型以及文字定位识别模型对待识别航运单图片进行识别,生成电子航运单,并将各电子航运单与待识别航运单图片进行关联,对未关联的各待识别航运单图片进行辅助修正;步骤S40、对未关联的各待识别航运单图片进行标注,并添加进标注数据集,对航运单类型识别模型以及文字定位识别模型进行训练优化。本发明专利技术的优点在于:极大的提升了航运单识别的效率以及准确率。确率。确率。

【技术实现步骤摘要】
一种基于深度学习的航运单识别方法


[0001]本专利技术涉及航运单识别
,特别指一种基于深度学习的航运单识别方法。

技术介绍

[0002]随着信息化技术的发展,越来越多的场景均需要使用电脑或是移动设备进行信息采录、处理等工作,利用信息化技术可以很大程度上节约人力成本及提升工作效率。
[0003]通过将航运单进行数字化也能提升工作效率,但由于各国的不同原因,存在部分环节的航运单未进行数字化,直接导致订单从预约、确认、配送及交付等环节无法使用相应的配套软件进行自动化处理。
[0004]针对未进行数字化的航运单,传统的做法是进行人工录入,录入的内容包括航运单中的公司信息、订单信息、地址信息等。但由于航运单的数量较大,需要投入大量的数据录入员,效率低下,且人工的准确率无法保证,往往会出现系统误判导致许多航运单的信息缺失。
[0005]因此,如何提供一种基于深度学习的航运单识别方法,实现提升航运单识别的效率以及准确率,成为一个亟待解决的问题。

技术实现思路

[0006]本专利技术要解决的技术问题,在于提供一种基于深度学习的航运单识别方法,实现提升航运单识别的效率以及准确率。
[0007]本专利技术是这样实现的:一种基于深度学习的航运单识别方法,包括如下步骤:
[0008]步骤S10、获取大量的航运单图片,对各所述航运单图片进行标注,生成标注数据集;
[0009]步骤S20、创建一航运单类型识别模型以及一文字定位识别模型,利用所述标注数据集分别对航运单类型识别模型以及文字定位识别模型进行训练;
[0010]步骤S30、利用训练后的所述航运单类型识别模型以及文字定位识别模型对待识别航运单图片进行识别,生成电子航运单,并将各所述电子航运单与待识别航运单图片进行关联,对未关联的各所述待识别航运单图片进行辅助修正;
[0011]步骤S40、对未关联的各所述待识别航运单图片进行标注,并添加进所述标注数据集,对所述航运单类型识别模型以及文字定位识别模型进行训练优化。
[0012]进一步地,所述步骤S10具体包括:
[0013]步骤S11、获取大量的航运单图片,对各所述航运单图片进行预处理,生成预处理图片;
[0014]步骤S12、利用SIFT算法提取所述预处理图片的特征向量;
[0015]步骤S13、利用DBSCAN聚类算法,基于所述特征向量对预处理图片进行分类;
[0016]步骤S14、分别对各类别的所述预处理图片的感兴趣区域进行人工标注,生成标注数据集。
[0017]进一步地,所述步骤S11中,所述对各所述航运单图片进行预处理具体为:
[0018]对各所述航运单图片进行灰度转换以及统一尺寸的预处理。
[0019]进一步地,所述步骤S14中,所述感兴趣区域至少包括公司LOGO区域、订单号区域、地址信息区域。
[0020]进一步地,所述步骤S20中,所述航运单类型识别模型采用YOLO框架,所述航运单类型识别模型包括一darkNet19网络模块以及一平均池化模块;所述darkNet19网络模块的激活函数采用tanh函数。
[0021]进一步地,所述步骤S20中,所述文字定位识别模型包括VGG19网络、卷积转换层、双向LMST网络以及CNN+CTCloss网络;
[0022]VGG19网络将提取的特征图像输入卷积转换层,卷积转换层调整所述特征图像的尺寸后,输入双向LMST网络进行上下文信息学习,对文字进行定位,再输入CNN+CTCloss网络对定位的文字进行识别。
[0023]进一步地,所述步骤S20中,所述利用所述标注数据集分别对航运单类型识别模型以及文字定位识别模型进行训练具体为:
[0024]设定一比例阈值,将所述标注数据集按预设的比例划分为训练集以及验证集;利用所述训练集对航运单类型识别模型以及文字定位识别模型进行训练,利用所述验证集对训练后的航运单类型识别模型以及文字定位识别模型进行验证,判断识别成功率是否大于所述比例阈值,若是,则完成训练;若否,则扩充所述训练集的样本量,继续训练。
[0025]进一步地,所述步骤S30中,所述对未关联的各所述待识别航运单图片进行辅助修正具体为:
[0026]利用编辑距离算法分别计算未关联的各所述待识别航运单图片与电子航运单的相似度,选取相似度最高的所述电子航运单进行人工辅助修正。
[0027]进一步地,所述步骤S40具体为:
[0028]对未关联的各所述待识别航运单图片中,识别错误的区域进行标注,并添加进所述标注数据集,利用扩充后的所述标注数据集对航运单类型识别模型以及文字定位识别模型进行训练优化,自动替换为识别成功率更高的所述航运单类型识别模型以及文字定位识别模型。
[0029]本专利技术的优点在于:
[0030]1、通过对大量的航运单图片进行标注生成标注数据集,利用标注数据集分别对航运单类型识别模型以及文字定位识别模型进行训练,再利用训练后的航运单类型识别模型以及文字定位识别模型对待识别航运单图片进行识别,相对于传统上通过人工肉眼识别,极大的提升了航运单识别的效率以及准确率。
[0031]2、通过SIFT算法提取预处理图片的特征向量,再利用DBSCAN聚类算法,基于特征向量对预处理图片进行分类,最终利用分类后的预处理图片的感兴趣区域进行人工标注,省去了人工分类的工作量,极大的提升了航运单图片标注的效率。
[0032]3、通过将darkNet19网络模块的激活函数由tanh函数替换传统的RELU函数,对于负值特征有更好的保留,极大的提升了航运单类型识别模型的泛化能力,通过用平均池化模块替换传统的最大值池化模块,避免周边特征的信息丢失,保证特征信息的完整性,能够更好的联系航运单图片的上下文,进而提高航运单类型识别模型的识别精度。
[0033]4、通过整合VGG19网络和双向LMST网络,使得文字定位识别模型能够更好的根据特征的上下文进行训练,进而提高文字定位识别模型的识别精度。
[0034]5、通过编辑距离算法分别计算未关联的各所述待识别航运单图片与电子航运单的相似度,选取相似度最高的电子航运单进行人工辅助修正,相对于人工进行全局查找和判定,极大的减轻了识别错误修正的工作量。
[0035]6、通过对未关联的各待识别航运单图片进行标注,并扩充标注数据集,利用扩充的标注数据集对航运单类型识别模型以及文字定位识别模型进行训练优化,进一步提升航运单类型识别模型以及文字定位识别模型的识别精度以及新场景的适应能力。
附图说明
[0036]下面参照附图结合实施例对本专利技术作进一步的说明。
[0037]图1是本专利技术一种基于深度学习的航运单识别方法的流程图。
具体实施方式
[0038]请参照图1所示,本专利技术一种基于深度学习的航运单识别方法的较佳实施例,包括如下步骤:
[0039]步骤S10、获取大量的航运单图片,对各所述航运单图片进行标注,生成标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的航运单识别方法,其特征在于:包括如下步骤:步骤S10、获取大量的航运单图片,对各所述航运单图片进行标注,生成标注数据集;步骤S20、创建一航运单类型识别模型以及一文字定位识别模型,利用所述标注数据集分别对航运单类型识别模型以及文字定位识别模型进行训练;步骤S30、利用训练后的所述航运单类型识别模型以及文字定位识别模型对待识别航运单图片进行识别,生成电子航运单,并将各所述电子航运单与待识别航运单图片进行关联,对未关联的各所述待识别航运单图片进行辅助修正;步骤S40、对未关联的各所述待识别航运单图片进行标注,并添加进所述标注数据集,对所述航运单类型识别模型以及文字定位识别模型进行训练优化。2.如权利要求1所述的一种基于深度学习的航运单识别方法,其特征在于:所述步骤S10具体包括:步骤S11、获取大量的航运单图片,对各所述航运单图片进行预处理,生成预处理图片;步骤S12、利用SIFT算法提取所述预处理图片的特征向量;步骤S13、利用DBSCAN聚类算法,基于所述特征向量对预处理图片进行分类;步骤S14、分别对各类别的所述预处理图片的感兴趣区域进行人工标注,生成标注数据集。3.如权利要求2所述的一种基于深度学习的航运单识别方法,其特征在于:所述步骤S11中,所述对各所述航运单图片进行预处理具体为:对各所述航运单图片进行灰度转换以及统一尺寸的预处理。4.如权利要求2所述的一种基于深度学习的航运单识别方法,其特征在于:所述步骤S14中,所述感兴趣区域至少包括公司LOGO区域、订单号区域、地址信息区域。5.如权利要求1所述的一种基于深度学习的航运单识别方法,其特征在于:所述步骤S20中,所述航运单类型识别模型采用YOLO框架,所述航运单类型识别模型包括一darkNet19网络模块以及一平均池化...

【专利技术属性】
技术研发人员:冯广辉王雷朱坚陆向东
申请(专利权)人:福建新大陆软件工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1