一种基于深度学习的面单信息定位方法和系统技术方案

技术编号:23625094 阅读:45 留言:0更新日期:2020-03-31 22:48
本发明专利技术公开了一种基于深度学习的面单信息定位方法和系统,能够对例如应用于快递领域的电子面单有效信息(例如收、寄件人信息)提供更加准确的定位服务。其技术方案为:通过卷积神经网络模型从输入的面单图像中提取图像特征和卷积层特征图;对不同卷积层数的特征图进行边界框的回归和分类;基于回归和分类的特征图,通过损失函数对卷积神经网络模型进行训练,产生候选框;从候选框中筛选出置信度最高、存在目标的区域,以得到边界框的位置信息;根据得到的边界框位置信息进行裁剪,以得到包括有效信息在内的图片。

A method and system of face information location based on deep learning

【技术实现步骤摘要】
一种基于深度学习的面单信息定位方法和系统
本专利技术涉及深度学习图像检测技术,具体涉及基于深度学习的(快递)面单信息定位方法和系统。
技术介绍
近些年来随着淘宝电商的快速发展,快递物流行业的业务量爆发式增长,特别是年中大促、双十一等特殊的电商节日,会产生大量的快递面单。这对快递公司在进行快递面单处理时带来很大的难度,如何对快递面单中的有效信息(即收、寄件人的信息)进行有效快速的处理是值得研究的问题。深度学习方法随着近几年深度学习理论的快速发展,取得了很大的进步,特别是检测精度比原有算法有了较大的提高。大量文献表明深度学习自我学习的特征可以更好地描述检测目标的特性,避免了复杂的特征提取和数据建模过程。深度学习方法中较为主流的是卷积神经网络CNN,最早用于Mnist手写数字字符数据集上。现在主流的目标检测算法是R-CNN系列两阶段目标检测器,最早的R-CNN算法使用了SelectiveSearch方法从一张图像生成约2000-3000个候选区域,然后通过卷积神经网络在候选区域提取特征并进行判断,之后出现的FastR-CNN、Faster-R本文档来自技高网...

【技术保护点】
1.一种基于深度学习的面单信息定位方法,其特征在于,方法包括:/n步骤1:通过卷积神经网络模型从输入的面单图像中提取图像特征和卷积层特征图;/n步骤2:对步骤1中输出的不同卷积层数的特征图进行边界框的回归和分类;/n步骤3:基于经步骤2回归和分类的特征图,通过损失函数对卷积神经网络模型进行训练,产生候选框;/n步骤4:从候选框中筛选出置信度最高、存在目标的区域,以得到边界框的位置信息;/n步骤5:根据得到的边界框位置信息进行裁剪,以得到包括有效信息在内的图片。/n

【技术特征摘要】
1.一种基于深度学习的面单信息定位方法,其特征在于,方法包括:
步骤1:通过卷积神经网络模型从输入的面单图像中提取图像特征和卷积层特征图;
步骤2:对步骤1中输出的不同卷积层数的特征图进行边界框的回归和分类;
步骤3:基于经步骤2回归和分类的特征图,通过损失函数对卷积神经网络模型进行训练,产生候选框;
步骤4:从候选框中筛选出置信度最高、存在目标的区域,以得到边界框的位置信息;
步骤5:根据得到的边界框位置信息进行裁剪,以得到包括有效信息在内的图片。


2.根据权利要求1所述的基于深度学习的面单信息定位方法,其特征在于,步骤1是采用VGG16卷积神经网络模型提取图像特征,在提取图像特征的同时输出不同卷积层特征图。


3.根据权利要求2所述的基于深度学习的面单信息定位方法,其特征在于,采用VGG16卷积神经网络模型中的前卷积层6-2层来进行特征提取,将卷积层6-2层之后的卷积层删除。


4.根据权利要求1所述的基于深度学习的面单信息定位方法,其特征在于,步骤2是采用一系列的小卷积模块来预测物体的类别与坐标,对具有不同感受野的不同层数的特征图进行回归和分类。


5.根据权利要求1所述的基于深度学习的面单信息定位方法,其特征在于,步骤3中的损失函数包括分类误差和定位误差,通过损失的最小化缩短分类和定位的预测误差。


6.根据权利要求1所述的基于深度学习的面单信息定位方法,其特征在于,步骤4中,任一张面单图像的特征图上含有多个物体检测的候选框,且该多个候选框有重叠部分,非极大值抑制的处理是用以保留最优的框,假设有N个框,每个框被分类器计算得到的分数为Si,其中1<=i<=N,非极大值抑制的处理步骤包括:
第一步:建造一个存放待处理候选框的集合H,初始化为包含全部N个框;建造一个存放最优框的集合M,初始化为空集;
第二步:将所有集合H中的框进行排序,选出分数最高的框m,从集合H移到集合M中;
第三步:遍历集合H中的框,分别与框m计算交并比,如果高于一阈值则认为此框与m重叠,将该框从集合H中去除;
第四步:回到第一步进行迭代,直到集合H为空,集合M中的框为面单图像中需要的框。


7.根据权利要求1所述的基于深度学习的面单信息定位方法,其特征在于,步骤5是通过openCV工具进行裁剪。


8.一种基于深度学习的面单信息定位系统,其特征在于,系统包括:
特征提取模块,用于通过卷积神经网络模型从输入的面单图像中提取图像特征和卷积层特征图;
回归分类模块,用于对特征提取模块输出的不同卷积层数的特征图进行边界框的回归和分类;
模型训练模块,用于基于回归分类模块输出的特征图,通过损失函数对卷积神经...

【专利技术属性】
技术研发人员:张春月孙跃峰
申请(专利权)人:圆通速递有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1