视觉识别方法、装置、设备及存储介质制造方法及图纸

技术编号：25043995 阅读：16 留言：0更新日期：2020-07-29 05:34

本发明专利技术提供了一种视觉识别方法、装置、设备及存储介质，该方法包括：若监测到用户拿取目标，则采集视频帧图片；确定每帧图片中的目标的感兴趣区域；提取每帧图片中的目标的感兴趣区域形成每帧目标图片；对每帧目标图片进行缩放处理，获得每帧目标缩放图片；采用第一目标检测算法对每帧目标缩放图片进行视觉识别，以获得识别结果。由于对每帧图片进行无效区域的排除，提取出目标的感兴趣区域进行缩放处理后作为第一目标检测算法的输入图片，放大了目标的感兴趣区域的比例，所以提高了目标的检出率和准确率。

全部详细技术资料下载

【技术实现步骤摘要】
视觉识别方法、装置、设备及存储介质
本专利技术实施例涉及计算机视觉
，尤其涉及一种视觉识别方法、装置、设备及存储介质。
技术介绍
随着移动互联网及人工智能的发展，涌现了无人售货柜，无人售货超市等来满足人们的购物需求，提高人们的购物体验。在无人售货柜或无人售货超市购物时，需要在人们从货架上选购商品的过程中对商品进行自动视觉识别。目标的视觉识别方法是通过架设在货架顶部的传感器采集包含目标的图像或视频序列并利用计算机视觉技术对图像或视频序列中的目标进行检测，实现对目标的分类，达到识别的结果。现有技术中，对目标的视觉识别方法主要有基于图像匹配的视觉识别方法，基于特征向量比对的视觉识别方法或基于深度学习的视觉识别方法。基于图像匹配的视觉识别方法中，利用图像的特征点进行匹配，根据采集的目标图片与注册库中的匹配度进行识别分类。基于特征向量比对的视觉识别方法提取采集的图片内目标的特征向量，并与注册库中的物品的特征向量进行距离度量判断相似度从而进行视觉识别。基于深度学习的视觉识别方法运用目标检测算法对图片中的目标进行目标定位，从而达到视觉识别的结果。目标检测算法可以为SSD算法。现有技术中的基于图像匹配的视觉识别方法和基于特征向量比对的视觉识别方法受光线变化和目标姿态变化的影响较大，并且算法复杂，耗时长。而现有技术中的基于SSD算法视觉识别方法虽然受光线变化和目标姿态变化的影响小，耗时短，但由于目标在无人售货柜或无人售货超市的货架上分多层摆放，架在顶部的摄像头拍摄的画面中的远景目标过小，导...

【技术保护点】
1.一种视觉识别方法，其特征在于，包括：/n若监测到拾取方拿取目标，则采集视频帧图片；/n确定每帧图片中的目标的感兴趣区域；/n提取所述每帧图片中的目标的感兴趣区域形成每帧目标图片；/n对所述每帧目标图片进行缩放处理，获得每帧目标缩放图片；/n采用第一目标检测算法对每帧目标缩放图片进行视觉识别，以获得识别结果。/n

【技术特征摘要】
1.一种视觉识别方法，其特征在于，包括：
若监测到拾取方拿取目标，则采集视频帧图片；
确定每帧图片中的目标的感兴趣区域；
提取所述每帧图片中的目标的感兴趣区域形成每帧目标图片；
对所述每帧目标图片进行缩放处理，获得每帧目标缩放图片；
采用第一目标检测算法对每帧目标缩放图片进行视觉识别，以获得识别结果。

2.根据权利要求1所述的方法，其特征在于，所述确定每帧图片中的目标的感兴趣区域，具体包括：
检测每帧图片中的拾取方的感兴趣区域；
根据所述每帧图片中的拾取方的感兴趣区域确定每帧图片中的目标的感兴趣区域。

3.根据权利要求2所述的方法，其特征在于，所述检测每帧图片中的拾取方的感兴趣区域，具体包括：
对所述每帧图片进行缩小处理；
采用第二目标检测算法检测缩小后的每帧图片中的拾取方的感兴趣区域。

4.根据权利要求2所述的方法，其特征在于，所述根据所述每帧图片中的拾取方的感兴趣区域确定每帧图片中的目标的感兴趣区域，具体包括：
若未检测到某帧图片的拾取方的感兴趣区域，则确定该帧图片中的目标的感兴趣区域为全图区域；
若检测到某帧图片的拾取方的感兴趣区域，则根据该帧图片的拾取方的感兴趣区域的个数确定每帧图片中的目标的感兴趣区域。

5.根据权利要求4所述的方法，其特征在于，所述拾取方的感兴趣区域为矩形框区域，所述根据该帧图片的拾取方的感兴趣区域的个数确定每帧图片中的目标的感兴趣区域，具体包括：
若该帧图片的拾取方的感兴趣区域为一个，则按照所述拾取方的感兴趣区域的长度和宽度的最大值的预设倍数从所述拾取方的感兴趣区域的中心点向四周确定该帧图片中的目标的感兴趣区域；
若该帧图片的拾取方的感兴趣区域为两个，则分别确定每个拾取方的感兴趣区域对应的待定目标的感兴趣区域，将包含两个待定目标的感兴趣区域的最小矩形区域确定为该帧图片的目标的感兴趣区域。

6.根据权利要求1所述的方法，其特征在于，所述采用第一目标检测算法对每帧目标缩放图片进行视觉识别，以获得识别结果，具体包括：
采用第一SSD算法对每帧目标缩放图片进行视觉识别，确定每帧目标缩放图片中的目标类别和数量；
若连续N帧识别出的每...

【专利技术属性】
技术研发人员：李耀波，刘旭，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人