一种基于深度学习和图像处理的货架商品模糊检测方法技术

技术编号:27269593 阅读:15 留言:0更新日期:2021-02-06 11:34
本发明专利技术公开了一种基于深度学习和图像处理的货架商品模糊检测方法,涉及人工智能计算机视觉、图像处理技术领域。本发明专利技术方法包括:S1、获取货架图片;S2、训练货架检测模型;S3、训练商品检测模型;S4、对货架图像进行检测,得到货架区域;S5、对货架区域内的像素计算拉普拉斯方差,如果高于阈值THRESHOLD_1则为清晰图片,反之进入S6;S6、对货架图像进行商品检测,得到商品的bbox列表;S7、对商品bbox区域的像素计算拉普拉斯方差;S8、判断是否为清晰图片,反之为模糊。本发明专利技术可以有效的分辨货架商品图片是否模糊,进而将模糊的货架图片筛除,提高系统的准确率。系统的准确率。系统的准确率。

【技术实现步骤摘要】
一种基于深度学习和图像处理的货架商品模糊检测方法


[0001]本专利技术涉及人工智能计算机视觉、图像处理
领域,特别是涉及一种基于深度学习和图像处理的货架商品模糊检测方法。

技术介绍

[0002]在新零售时代,零售生产商为了更好地掌控线下商品的售卖情况,通常会派遣业代人员去超市卖场进行拍照巡检,然后对商品的陈列方式进行审核。这就必须要求采集的货架商品图片是清晰的,否则无法准确的识别商品类别。为了达到这个目的,需要对采集的货架商品图片进行模糊检测。
[0003]检测图像是否模糊,通常直接采用拉普拉斯方差法,即对图像的每个像素点计算拉普拉斯梯度,然后再计算其方差,通常方差越大说明图像越清晰,反之图像越模糊。现有技术中主要有:直接对全局图像使用拉普拉斯方差法,很容易受到非货架区域的干扰,例如货架区域比较模糊,但是非货架区域很清晰的情况下,这种判断方法容易失效;某些商品本身像素差异不大,比如一瓶酱油,除去标签部分其他地方都是黑色的,直接使用拉普拉斯方差法,算出的方差值很低,容易被误判成模糊。因此,针对以上问题,提供一种基于深度学习和图像处理的货架商品模糊检测方法具有重要意义。

技术实现思路

[0004]本专利技术提供了一种基于深度学习和图像处理的货架商品模糊检测方法,解决了以上问题。
[0005]为解决上述技术问题,本专利技术是通过以下技术方案实现的:
[0006]本专利技术的一种基于深度学习和图像处理的货架商品模糊检测方法,包括如下步骤:
[0007]S1、获取不同角度,不同光照,不同分辨率的货架图片;
[0008]S2、训练货架检测模型;
[0009]S3、训练商品检测模型;
[0010]S4、对货架图像进行检测,得到货架的bbox,即为货架区域;
[0011]S5、对货架区域内的像素计算拉普拉斯方差,如果高于阈值THRESHOLD_1则为清晰图片,反之进入S6;
[0012]S6、对货架图像进行商品检测,得到商品的bbox列表;
[0013]S7、对商品bbox区域的像素计算拉普拉斯方差;
[0014]S8、如果超过一半的商品的拉普拉斯方差大于THRESHOLD_2,则为清晰图片,反之为模糊。
[0015]进一步地,所述S2步骤具体包括如下步骤:
[0016]S21、收集不同角度,光照的货架图片;
[0017]S22、对部分商品图片进行人工标注训练一个较弱的货架检测模型M0;
[0018]S23、使用M0对全量数据进行预标注,人工调整;
[0019]S24、使用全量数据训练货架检测模型M1。
[0020]进一步地,所述S3步骤具体包括如下步骤:
[0021]S31、收集不同角度,光照的货架商品图片;
[0022]S32、对部分商品图片进行人工标注训练一个较弱的商品检测模型M2;
[0023]S33、使用M0对全量数据进行预标注,人工调整;
[0024]S34、使用全量数据训练商品检测模型M3。
[0025]本专利技术相对于现有技术包括有以下有益效果:
[0026]本专利技术的一种基于深度学习和图像处理的货架商品模糊检测方法可以有效的分辨货架商品图片是否模糊,进而将模糊的货架图片筛除,提高系统的准确率。
[0027]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
[0028]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本专利技术的一种基于深度学习和图像处理的货架商品模糊检测方法的整体步骤图;
[0030]图2为本专利技术的一种基于深度学习和图像处理的货架商品模糊检测方法的原理图。
具体实施方式
[0031]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0032]请参阅图1-2所示,本专利技术的一种基于深度学习和图像处理的货架商品模糊检测方法,包括如下步骤:
[0033]S1、获取不同角度,不同光照,不同分辨率的货架图片;
[0034]S2、训练货架检测模型;
[0035]S3、训练商品检测模型;
[0036]S4、对货架图像进行检测,得到货架的bbox,即为货架区域;
[0037]S5、对货架区域内的像素计算拉普拉斯方差,如果高于阈值THRESHOLD_1则为清晰图片,反之进入S6;
[0038]S6、对货架图像进行商品检测,得到商品的bbox列表;
[0039]S7、对商品bbox区域的像素计算拉普拉斯方差;
[0040]S8、如果超过一半的商品的拉普拉斯方差大于THRESHOLD_2,则为清晰图片,反之为模糊。
[0041]其中,S2步骤具体包括如下步骤:
[0042]S21、收集不同角度,光照的货架图片;
[0043]S22、对部分商品图片进行人工标注训练一个较弱的货架检测模型M0;
[0044]S23、使用M0对全量数据进行预标注,人工调整;
[0045]S24、使用全量数据训练货架检测模型M1。
[0046]其中,S3步骤具体包括如下步骤:
[0047]S31、收集不同角度,光照的货架商品图片;
[0048]S32、对部分商品图片进行人工标注训练一个较弱的商品检测模型M2;
[0049]S33、使用M0对全量数据进行预标注,人工调整;
[0050]S34、使用全量数据训练商品检测模型M3。
[0051]如图2所示,本方案主要使用两大技术,目标检测和拉普拉斯方差法;
[0052]1、目标检测:使用RetinaNet的目标检测模型。此模型可以兼顾检测精度和检测速度。RetinaNet使用了Focal Loss能够很好的平衡前景和背景目标,可以使检测器更加集中于难区分的目标,从而提升检测精度;同时又由于它本身的单阶段设计框架,使其能够达到一个较高的FPS(在Nvidia Tesla V100上可达15FPS)。
[0053]获得一个基于RetinaNet的商品检测模型具体步骤如下:
[0054]S1.收集不同角度,光照的货架商品图片
[0055]S2.对部分商品图片进行人工标注训练一个较弱的商品检测模型M0
[0056]S3.使用M0对全量数据进行预标注,人工调整
[0057]S4.使用全量数据训练商品检测模型M1
[0058]RetinaNet训练设置:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习和图像处理的货架商品模糊检测方法,其特征在于,包括如下步骤:S1、获取不同角度,不同光照,不同分辨率的货架图片;S2、训练货架检测模型;S3、训练商品检测模型;S4、对货架图像进行检测,得到货架的bbox,即为货架区域;S5、对货架区域内的像素计算拉普拉斯方差,如果高于阈值THRESHOLD_1则为清晰图片,反之进入S6;S6、对货架图像进行商品检测,得到商品的bbox列表;S7、对商品bbox区域的像素计算拉普拉斯方差;S8、如果超过一半的商品的拉普拉斯方差大于THRESHOLD_2,则为清晰图片,反之为模糊。2.根据权利要求1所述的一种基于深度学习和图像处理...

【专利技术属性】
技术研发人员:魏勋李一帆
申请(专利权)人:上海品览数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1