一种标识码定位方法和标识码定位装置制造方法及图纸

技术编号:36910585 阅读:12 留言:0更新日期:2023-03-18 09:29
本发明专利技术提供了一种标识码定位方法和标识码定位装置,该标识码定位方法采用的标识码定位模型中包含了角度分类分支网络,通过角度分类分支网络预测得到定位框的预测角度类别,从而将通过角度纠正后的定位框确定为最后的定位框。本方案通过尽量减少框定标识码的定位框中的背景区域面积,以避免较大的背景区域对后续的解码流程产生较大的干扰,尽量减少解码失败或不能正确解码的概率。同时本方案通过使训练得到的标识码定位模型能够提取各个角度的标识码并做角度矫正,很大程度提升了标识码的识别准确率。识别准确率。识别准确率。

【技术实现步骤摘要】
一种标识码定位方法和标识码定位装置


[0001]本专利技术涉及标识码识别
,尤其涉及一种标识码定位方法和标识码定位装置。

技术介绍

[0002]一维码在计算机应用和实践中产生并发展起来,广泛应用于商业、邮政、图书管理、仓储、工业生产过程控制、交通等领域的信息存储。特别是在工业生产中,大部分产品需要存储和追溯产地、类型、生产日期、重量、大小等信息。随着需要储存的信息越来越多,二维码应运而生。二维码能够在横向和纵向两个方位同时表达信息,因此能在很小的面积内表达大量的信息。一维码和二维码具有输入速度快、准确度高、成本低、可靠性强等优点。
[0003]目前的扫码器识别贴设在产品表面的标识码时,先形成框定标识码的定位框,之后读取定位框中的标识码。其中,定位框通常是固定的矩形框,标识码可能贴设在产品上的任意位置,因此,定位框所框定的区域除了包含标识码之外,可能还框定了较大的背景区域。识别定位框内的标识码过程中,背景区域会对识别标识码造成较大的干扰,可能导致不能正确解码。

技术实现思路

[0004]本专利技术提供了一种标识码定位方法和标识码定位装置,尽量减少框定标识码的定位框中的背景区域面积,以避免背景区域对的解码流程产生较大的干扰,尽量减少不能正确解码的概率。
[0005]第一方面,本专利技术提供了一种标识码定位方法,该标识码定位方法包括:
[0006]获取待检测图像;
[0007]采用标识码定位模型处理待检测图像,识别得到若干定位框;标识码定位模型为采用若干样本图像对深度学习模型进行训练得到;
[0008]基于各定位框的置信分数,筛选出置信分数最高的定位框;
[0009]将置信分数最高的定位框所形成的区域确认为待检测图像的标识码区域;
[0010]其中,标识码定位模型基于以下步骤训练得到:
[0011]获取若干样本图像,并对样本图像中的标识码区域进行标注,得到标注数据集;标注数据集包括样本图像中的标识码区域的真实位置信息;
[0012]通过深度学习模型的特征提取网络提取样本图像的图像特征,得到样本图像的特征图;
[0013]采用深度学习模型的回归分支网络和角度分类分支网络分别处理特征图,得到预测定位框位置信息和预测角度类别;
[0014]基于预测定位框位置信息和预测角度类别得到若干预测定位框;
[0015]通过真实位置信息、预测定位框位置信息和预测角度类别构建深度学习模型的损失函数;
[0016]根据使损失函数最小化时的方向分别调整回归分支网络和角度分类分支网络的网络参数,以得到标识码定位模型。
[0017]在上述的方案中,构建的标注数据集中的每张样本图像中既包含标识码区域以及背景区域,从而能够直接将相机拍摄的包含标识码的图像作为样本图像,无需进行预处理操作,从而简便形成标注数据集的工作量。在标识码定位模型中包含了角度分类分支网络,通过角度分类分支网络预测得到定位框的预测角度类别,从而最后确定的定位框为角度纠正后的定位框。从而尽量减少框定标识码的定位框中的背景区域面积,以避免较大的背景区域对后续的解码流程产生较大的干扰,尽量减少解码失败或不能正确解码的概率。使训练得到的标识码定位模型能够提取各个角度的标识码并做角度矫正,很大程度提升了标识码的识别准确率。且由于标注数据集中的样本图像包含背景区域,从而可以采集不同应用场景下的包含标识码的图像作为样本图像,使训练得到的标识码定位模型能够适应于不同的检测场景,普适性高,节省变更算法消耗的时间。
[0018]在一个具体的实施方式中,对样本图像中的标识码区域进行标注,得到标注数据集,包括:标注样本图像中的标识码区域的真实位置信息,真实位置信息包括标识码区域的长宽信息和角度信息。
[0019]在一个具体的实施方式中,通过真实位置信息、预测定位框位置信息和预测角度类别构建深度学习模型的损失函数,包括:
[0020]按照如下公式求取各预测定位框位置信息损失值L
loc
(x,y,w,h):
[0021][0022]其中,N表示预测定位框的数量;i表示第i个预测定位框;x
i
、y
i
分别表示第i个预测定位框的中心点横坐标、纵坐标;w
i
、h
i
分别表示第i个预测定位框的长和宽;分别表示x的平均值和y的平均值;分别表示w的平均值和h的平均值;当第i个预测定位框框住了样本图像中的标识码区域的真实位置时,值为1,否则为0。
[0023]在一个具体的实施方式中,根据使损失函数最小化时的方向调整回归分支网络的网络参数,包括:根据使预测定位框位置信息损失值最小化时的方向,调整回归分支网络的网络参数。
[0024]在一个具体的实施方式中,角度分类分支网络中包含有M个预设角度类别,每个预设角度类别的步进角度为(360/M)
°
;采用角度分类分支网络处理特征图,得到预测定位框的预测角度类别包括:按照如下公式求取各预测定位框的角度分类损失值L
ang

[0025][0026]其中,c为预测定位框的预设角度类别,取值范围为0~M中的整数;在c为0时,表示预测定位框旋转角度为0;当预测定位框的角度类别与样本图像中标识码区域真实位置的角度类别均为c时,y
c
值为1,否则为0;p
c
表示若干预测定位框中,角度类别为c的预测定位框的概率。
[0027]在一个具体的实施方式中,根据使损失函数最小化时的方向调整角度分类分支网
络的网络参数,包括:根据使预测定位框的角度分类损失值最小化时的方向,调整角度分类分支网络的网络参数。
[0028]在一个具体的实施方式中,基于各定位框的置信分数,筛选出置信分数最高的定位框,包括:
[0029]按照如下公式求取若干定位框的置信度损失值L
conf
(C):
[0030][0031]其中,i表示第i个定位框;C表示第i个定位框的置信度;表示置信度理论值;当第i个定位框框住了待检测图像中的标识码区域的真实位置时,等于1,等于0,等于1;否则,等于0,等于1,等于0;γ
noobj
表示一个可设置的权重值;
[0032]根据若干定位框的置信度损失值L
conf
(C),筛选出置信分数最高的定位框。
[0033]在一个具体的实施方式中,将置信分数最高的定位框所形成的区域确认为待检测图像的标识码区域,包括:使用置信度最高的定位框与若干定位框中剩余的定位框进行一一重叠度比较;当剩余的定位框中某一定位框与置信度最高的定位框之间的重叠度超过预设值时,将某一定位框丢弃;上述操作完成后,保留的定位框中框定了标识码区域。
[0034]在一个具体的实施方式中,通过深度学习模型的特征提取网络提取样本图像的图像特征,得到样本图像的特征图,包括:对样本图像进行多层卷积得到尺寸由大到小的多个卷积层;且特征提取网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标识码定位方法,其特征在于,包括:获取待检测图像;采用标识码定位模型处理所述待检测图像,识别得到若干定位框;所述标识码定位模型为采用若干样本图像对深度学习模型进行训练得到;基于各所述定位框的置信分数,筛选出置信分数最高的定位框;将所述置信分数最高的定位框所形成的区域确认为所述待检测图像的标识码区域;其中,所述标识码定位模型基于以下步骤训练得到:获取若干样本图像,并对所述样本图像中的标识码区域进行标注,得到标注数据集;所述标注数据集包括所述样本图像中的标识码区域的真实位置信息;通过所述深度学习模型的特征提取网络提取所述样本图像的图像特征,得到所述样本图像的特征图;采用所述深度学习模型的回归分支网络和角度分类分支网络分别处理所述特征图,得到预测定位框位置信息和预测角度类别;基于所述预测定位框位置信息和所述预测角度类别得到若干预测定位框;通过所述真实位置信息、所述预测定位框位置信息和所述预测角度类别构建所述深度学习模型的损失函数;根据使所述损失函数最小化时的方向分别调整所述回归分支网络和角度分类分支网络,以得到标识码定位模型。2.如权利要求1所述的标识码定位方法,其特征在于,所述标注所述样本图像中的标识码区域的真实位置信息,以得到所述标注数据集中,所述真实位置信息包括所述标识码区域的长宽信息和角度信息。3.如权利要求2所述的标识码定位方法,其特征在于,所述通过所述真实位置信息、所述预测定位框位置信息和所述预测角度类别构建所述深度学习模型的损失函数,包括:按照如下公式求取各所述预测定位框的位置信息损失值L
loc
(x,y,w,h):中,N表示所述预测定位框的数量;i表示第i个预测定位框;x
i
、y
i
分别表示所述第i个预测定位框的中心点横坐标、纵坐标;w
i
、h
i
分别表示所述第i个预测定位框的长和宽;分别表示x的平均值和y的平均值;分别表示w的平均值和h的平均值;当所述第i个预测定位框框住了所述样本图像中的标识码区域的真实位置时,值为1,否则为0。4.如权利要求3所述的标识码定位方法,其特征在于,根据使所述损失函数最小化时的方向调整所述回归分支网络的网络参数,包括:根据使所述预测定位框的位置信息损失值最小化时的方向,调整所述回归分支网络的网络参数。
5.如权利要求3所述的标识码定位方法,其特征在于,所述角度分类分支网络中包含有M个预设角度类别,每个所述预设角度类别的步进角度为(360/M)
°
;采用所述角度分类分支网络处理所述特征图,得到所述预测角度类别,包括:按照如下公式求取各所述预测定位框的角度分类损失值L
ana
:c为所述预测定位框的预设角度类别,取值范围为0~M中的整数;在c为0时,表示所述预测定位框的旋转角度为0;当所述预测定位框的角度类别与所述样本图像中标识码区域真实位置的角度类别均为c时,y
c
值为1,否则为0;p<...

【专利技术属性】
技术研发人员:文丁庞远超韦展琨
申请(专利权)人:深圳市九牛一毛智能物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1