一种货柜场景下基于多层级分类的商品动态视觉识别方法技术

技术编号：34391723 阅读：46 留言：0更新日期：2022-08-03 21:20

本发明专利技术提供了一种货柜场景下基于多层级分类的商品动态视觉识别方法，包括：S1、根据货柜中的商品的特性，对每件商品设置多层级标签；S2、获取商品的跟踪视频，对视频进行预处理；S3、使用目标检测网络对每一帧图像进行物体检测，定位商品出现的位置，并对商品进行第一级标签的分类；S4、结合光流检测和逻辑推理，对商品进行轨迹跟踪，获得商品的轨迹；S5、使用残差分类网络对商品进行第二级标签及以下的细粒度分类；S6、使用投票策略得到每条商品轨迹的最后一级标签，最终得到商品在货柜中的进出记录。本发明专利技术能够更有效地提取视觉识别信息，从而实现对货柜商品精准及高效的识别。从而实现对货柜商品精准及高效的识别。从而实现对货柜商品精准及高效的识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种货柜场景下基于多层级分类的商品动态视觉识别方法

[0001]本专利技术涉及深度学习算法领域，具体涉及一种货柜场景下基于多层级分类的商品动态视觉识别方法。

技术介绍

[0002]在无人零售场景下，如何更好地识别商品信息，从而实现交易自动化，一直是一个受到广泛关注的课题。
[0003]现阶段货柜场景下的商品识别方法主要有：RFID识别技术、重力监测感应算法、静态商品识别算法和动态识别算法。
[0004]RFID识别技术具体指为每个商品贴上标签，通过与硬件设施之间进行无线数据传输，利用输入的无线标签信息从而实现商品识别。重力监测感应算法的输入主要是重量变化以及商品的位置信息，通过对这些信息和记录的重力信息等匹配来对商品的品类进行推导。静态商品识别算法依托于神经网络，通过对输入图像的检测识别获取图像区域内商品数目的变化信息，从而推理得到用户购物清单。
[0005]然而，现有的商品识别技术容易受到商品的品类、商品的位置信息等等干扰，从而导致其在实际场景下有一定的局限性。具体来说，RFID技术不适合金属包装商品，这就导致其对于大多数主流的商品不能进行有效的识别，同时，为商品添加RFID标志需要消耗大量人力成本，比起对数据集的标注需要更大的精力。而对于重力检测技术，由于重力相似的情况十分常见，仅使用重力信息的变化作为特征不足够挖掘出在实际场景中丰富的商品信息。
[0006]静态视觉识别算法不能获取丰富的视频信息，无法对商品进行高效的跟踪，在实际应用场景下可能出现错检，漏检等问题。
[00...

【技术保护点】

【技术特征摘要】
1.一种货柜场景下基于多层级分类的商品动态视觉识别方法，其特征在于，包括：S1、根据货柜中的商品的特性，对每件商品设置多层级标签；通过所述多层级标签对商品进行由粗到细的分类；所述多层级标签包括至少三级，其中第一级标签根据商品的包装形态划分，第二级标签根据商品的体积大小划分，第三级标签及以下根据更细粒度的特征划分，直至最后一级标签为商品的具体信息；S2、获取商品的跟踪视频，对视频进行预处理：对视频进行抽帧后，使用分割算法对每一帧图像进行分割，剔除无效区域；S3、使用目标检测网络对每一帧图像进行物体检测，定位商品出现的位置，并对商品进行第一级标签的分类；S4、结合光流检测和逻辑推理，对商品进行轨迹跟踪，获得商品的轨迹；S5、使用残差分类网络对商品进行第二级标签及以下的细粒度分类；S6、使用投票策略得到每条商品轨迹的最后一级标签，最终得到商品在货柜中的进出记录。2.根据权利要求1所述的商品动态视觉识别方法，其特征在于，所述多层级标签包括三级，其中第一级标签根据商品的包装形态划分，第二级标签根据商品的体积大小划分，第三级标签为商品的具体信息。3.根据...

【专利技术属性】
技术研发人员：吴博文，何子健，龚科，陈添水，
申请(专利权)人：拓元广州智慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人