一种图像识别的自动化物流处理方法技术

技术编号:37785666 阅读:10 留言:0更新日期:2023-06-09 09:16
本发明专利技术涉及自动化物流处理的技术领域,揭露了一种图像识别的自动化物流处理方法,所述方法包括:构建图像校正模型以及训练目标函数,对训练目标函数进行求解得到最优图像校正模型;获取待识别物流单据图像并输入到最优图像校正模型中进行校正;构建非完整文本识别模型;从校正后的物流单据图像中截取物流文本信息区域图像,并将截取结果输入到非完整文本识别模型进行修复得到物流文本信息图像,根据物流文本信息图像的识别结果进行自动化物流处理。本发明专利技术通过构建图像校正模型实现物流单据图像的扭曲校正处理,并利用非完整文本识别模型对其中的非完整字符进行修复,实现对破损、变形物流单据的精准识别,提高自动化物流效率。率。率。

【技术实现步骤摘要】
一种图像识别的自动化物流处理方法


[0001]本专利技术涉及自动化物流的
,尤其涉及一种图像识别的自动化物流处理方法。

技术介绍

[0002]跨境物流运输过程中,由于货舱挤压、货物破损等状况导致的订单信息缺失会造成物流订单自动化识别失效等问题,降低物流自动化水平。针对该问题,本专利技术提出一种图像识别的自动化物流处理方法实现对破损、变形订单信息的精准识别,提高自动化物流效率。

技术实现思路

[0003]有鉴于此,本专利技术提供一种图像识别的自动化物流处理方法,目的在于:1)构建图像校正模型,将待识别物流单据图像像素映射到三维空间,从而基于三维空间表示结果对扭曲像素进行度量,并利用图像校正模型输出待识别物流单据图像像素的映射关系函数,利用映射关系函数将待识别物流单据图像像素进行映射,实现待识别物流单据图像中扭曲像素的校正;2)构建结合三维空间表示像素梯度与扭曲校正后图像结构差异的训练目标函数,通过对训练目标函数进行求解,得到图像校正模型的模型参数,并利用非完整文本识别模型对校正后物流单据图像中的非完整字符进行补全处理,得到补全修复后的物流文本信息图像,并对物流文本信息图像进行识别,根据识别结果实现自动化物流处理。
[0004]实现上述目的,本专利技术提供的一种图像识别的自动化物流处理方法,包括以下步骤:
[0005]S1:构建图像校正模型以及训练目标函数,对训练目标函数进行求解得到图像校正模型的模型参数,并基于模型参数构建最优图像校正模型;
[0006]S2:获取待识别物流单据图像并输入到最优图像校正模型中,得到校正后的物流单据图像;
[0007]S3:构建非完整文本识别模型,所构建模型以含有非完整文字的物流文本信息区域图像为输入,以修复后可识别的物流文本信息区域图像为输出;
[0008]S4:从校正后的物流单据图像中截取物流文本信息区域图像,并将截取结果输入到非完整文本识别模型,得到修复后可识别的物流文本信息区域图像;
[0009]S5:将修复后可识别的物流文本信息区域图像进行最优修复拼接得到完整的物流文本信息图像,并对物流文本信息图像进行识别,根据识别结果进行自动化物流处理。
[0010]作为本专利技术的进一步改进方法:
[0011]可选地,所述S1步骤中构建图像校正模型以及训练目标函数,包括:
[0012]构建图像校正模型,其中图像矫正模型的输入为存在图像扭曲的待识别物流单据图像,输出为扭曲校正后的物流单据图像;
[0013]图像校正模型包括输入层、编码层以及解码层,输入层用于接收存在图像扭曲的
待识别物流单据图像,并将待识别物流单据图像中像素坐标转换到三维坐标系中,得到三维表示的待识别物流单据图像,并将三维表示的待识别物流单据图像输入到编码层中,得到编码表示结果,将编码表示结果输入到解码层中,得到待识别物流单据图像中像素坐标的映射关系函数,依据像素坐标之间的映射关系函数,将待识别物流单据图像中的像素进行映射,所有像素的映射后结果即为扭曲校正后的物流单据图像;其中编码层和解码层的结构为多个DenseNet模块的级联;
[0014]获取H组训练数据构成训练数据集,其中每组训练数据包括存在扭曲的待识别物流单据图像以及对应校正后的物流单据图像;
[0015]构建图像校正模型的训练目标函数L(θ):
[0016][0017]其中:
[0018]θ表示图像校正模型中的待求解参数,为编码层和解码层中多个DenseNet模块参数构成的权重矩阵;
[0019]表示图像中所有像素的梯度序列,表示图像中所有像素在水平方向的梯度序列,表示图像中所有像素在垂直方向的梯度序列;
[0020]||
·
||1表示L1范数,||
·
||2表示L2范数;
[0021]表示第h组训练数据中校正后物流单据图像的梯度序列,表示利用图像校正模型对第h组训练数据中的待识别物流单据图像进行校正处理,所得到的校正后图像的梯度序列;
[0022]μ
h
表示第h组训练数据中校正后物流单据图像的灰度值均值,σ
h
表示第h组训练数据中校正后物流单据图像的灰度值标准差;
[0023]表示利用图像校正模型对第h组训练数据中的待识别物流单据图像进行校正处理,所得到的校正后图像的灰度值均值;
[0024]表示利用图像校正模型对第h组训练数据中的待识别物流单据图像进行校正处理,所得到的校正后图像的灰度值标准差。
[0025]在本专利技术实施例中,图像像素的灰度值为像素在RGB颜色分量的最大值。
[0026]可选地,所述S1步骤中对训练目标函数进行求解得到图像校正模型的模型参数,并基于模型参数构建最优图像校正模型,包括:
[0027]对训练目标函数进行求解得到图像校正模型的模型参数,其中图像校正模型的模型参数求解流程为:
[0028]S11:设置参数求解算法的当前迭代次数为t,t的初始值为1,并随机生成图像校正模型的初始参数θ0;
[0029]S12:计算第t次迭代时训练目标函数L(θ)的梯度g
t

[0030][0031]S13:计算对应梯度g
t
的移动平均指数和(g
t
)2的移动平均指数:
[0032]r
t
=α1r
t
‑1+(1

α1)g
t
[0033]v
t
=α2v
t
‑1+(1

α2)(g
t
)2[0034]其中:
[0035]r
t
表示第t次迭代时梯度g
t
的移动平均指数,r0=0;
[0036]α1表示指数衰减率,将其设置为0.9;
[0037]α2表示指数衰减率,将其设置为0.99;
[0038]S14:更新图像校正模型参数:
[0039][0040]其中:
[0041]θ
t
为第t次迭代时神经网络模型的参数;
[0042]β为学习率,将其初始值设置为0.001,若训练目标函数值在最近5次迭代下降后没有继续下降,则将学习率减小为原来的1/2;
[0043]S15:若小于阈值,则终止算法迭代,将θ
t
作为求解得到的模型参数,并基于模型参数构建最优图像校正模型;否则令t=t+1,返回步骤S12。
[0044]可选地,所述S2步骤中获取待识别物流单据图像并输入到最优图像校正模型中,包括:
[0045]获取待识别物流单据图像,并将待识别物流单据图像输入到最优图像校正模型中,其中基于最优图像校正模型的待识别物流单据图像校正流程为:
[0046]S21:最优图像校正模型的输入层接收待识别物流单据图像,并将待识别物流单据图像中像素坐标转换到三维坐标系中,得到三维表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别的自动化物流处理方法,其特征在于,所述方法包括:S1:构建图像校正模型以及训练目标函数,对训练目标函数进行求解得到图像校正模型的模型参数,并基于模型参数构建最优图像校正模型;S2:获取待识别物流单据图像并输入到最优图像校正模型中,得到校正后的物流单据图像;S3:构建非完整文本识别模型,所构建模型以含有非完整文字的物流文本信息区域图像为输入,以修复后可识别的物流文本信息区域图像为输出;S4:从校正后的物流单据图像中截取物流文本信息区域图像,并将截取结果输入到非完整文本识别模型,得到修复后可识别的物流文本信息区域图像;S5:将修复后可识别的物流文本信息区域图像进行最优修复拼接得到完整的物流文本信息图像,并对物流文本信息图像进行识别,根据识别结果进行自动化物流处理。2.如权利要求1所述的一种图像识别的自动化物流处理方法,其特征在于,所述S1步骤中构建图像校正模型以及训练目标函数,包括:构建图像校正模型,其中图像矫正模型的输入为存在图像扭曲的待识别物流单据图像,输出为扭曲校正后的物流单据图像;图像校正模型包括输入层、编码层以及解码层,输入层用于接收存在图像扭曲的待识别物流单据图像,并将待识别物流单据图像中像素坐标转换到三维坐标系中,得到三维表示的待识别物流单据图像,并将三维表示的待识别物流单据图像输入到编码层中,得到编码表示结果,将编码表示结果输入到解码层中,得到待识别物流单据图像中像素坐标的映射关系函数,依据像素坐标之间的映射关系函数,将待识别物流单据图像中的像素进行映射,所有像素的映射后结果即为扭曲校正后的物流单据图像;其中编码层和解码层的结构为多个DenseNet模块的级联;获取H组训练数据构成训练数据集,其中每组训练数据包括存在扭曲的待识别物流单据图像以及对应校正后的物流单据图像;构建图像校正模型的训练目标函数L(θ):构建图像校正模型的训练目标函数L(θ):其中:θ表示图像校正模型中的待求解参数,为编码层和解码层中多个DenseNet模块参数构成的权重矩阵;表示图像中所有像素的梯度序列,表示图像中所有像素在水平方向的梯度序列,表示图像中所有像素在垂直方向的梯度序列;||
·
||1表示L1范数,||
·
||2表示L2范数;表示第h组训练数据中校正后物流单据图像的梯度序列,表示利用图像校正模型对第h组训练数据中的待识别物流单据图像进行校正处理,所得到的校正后图像的梯度序列;
μ
h
表示第h组训练数据中校正后物流单据图像的灰度值均值,σ
h
表示第h组训练数据中校正后物流单据图像的灰度值标准差;表示利用图像校正模型对第h组训练数据中的待识别物流单据图像进行校正处理,所得到的校正后图像的灰度值均值;表示利用图像校正模型对第h组训练数据中的待识别物流单据图像进行校正处理,所得到的校正后图像的灰度值标准差。3.如权利要求2所述的一种图像识别的自动化物流处理方法,其特征在于,所述S1步骤中对训练目标函数进行求解得到图像校正模型的模型参数,并基于模型参数构建最优图像校正模型,包括:对训练目标函数进行求解得到图像校正模型的模型参数,其中图像校正模型的模型参数求解流程为:S11:设置参数求解算法的当前迭代次数为t,t的初始值为1,并随机生成图像校正模型的初始参数θ0;S12:计算第t次迭代时训练目标函数L(θ)的梯度g
t
:S13:计算对应梯度g
t
的移动平均指数和(g
t
)2的移动平均指数:r
t
=α1r
t
‑1+(1

α1)g
t
v
t
=α2v
t
‑1+(1

α2)(g
t
)2其中:r
t
表示第t次迭代时梯度g
t
的移动平均指数,r0=0;α1表示指数衰减率,将其设置为0.9;α2表示指数衰减率,将其设置为0.99;S14:更新图像校正模型参数:其中:θ
t
为第t次迭代时神经网络模型的参数;β为学习率,将其初始值设置为0.001,若训练目标函数值在最近5次迭代下降后没有继续下降,则将学习率减小为原来的1/2;S15:若小于阈值,则终止算法迭代,将θ
t
作为求解得到的模型参数,并基于模型参数构建最优图像校正模型;否则令t=t+1,返回步骤S12。4.如权利要求1所述的一种图像识别的自动化物流处理方法,其特征在于,所述S2步骤中获取待识别物流单据图像并输入到最优图像校正模型中,包括:获取待识别...

【专利技术属性】
技术研发人员:李强王宏杨靖
申请(专利权)人:上海朗晖慧科技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1