一种商品定位识别方法、装置、设备以及存储介质制造方法及图纸

技术编号：20682113 阅读：21 留言：0更新日期：2019-03-27 19:16

本发明专利技术公开了一种商品定位识别方法，通过获取输入的待识别图像；将待识别图像输入至预先训练的神经网络模型中，提取出待识别图像中商品对应的区域；预先训练的神经网络模型为Faster‑RCNN网络模型；截取商品对应的区域作为子图，输入至预先训练的图像分类神经网络模型；预先训练的图像分类神经网络模型为VGG‑Net网络模型；由图像分类神经网络模型计算出子图属于各个商品类别的概率，识别出待识别图像中商品的类别。本申请可以减少显存占用，约十倍提升检测的速度，同时还能够提升识别的准确率。此外，本申请还提供了一种具有上述技术效果的商品定位识别装置、设备以及计算机可读存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
一种商品定位识别方法、装置、设备以及存储介质
本专利技术涉及计算机视觉
，特别是涉及一种商品定位识别方法、装置、设备以及计算机可读存储介质。
技术介绍
使用深度学习和计算机视觉技术对商品进行识别是无人零售中的重要一环，是实现智能结算台的核心技术。目前主流的基于深度学习的目标检测算法包括Faster-RCNN、SSD、YOLO等。两步式算法Faster-RCNN具有精准的定位和识别效果，然而在类别数目较大的时候，该算法会占据大量的显存，识别速度成比例下降，识别准确率难以控制。一步式算法SSD和YOLO在识别速度上有明显提升，而定位不够精准，识别准确率也低于Faster-RCNN。鉴于此，提供一种减少显存占用，且同时提升检测速度以及识别准确率的商品定位识别方法是非常有必要的。
技术实现思路
本专利技术的目的是提供一种商品定位识别方法、装置、设备以及计算机可读存储介质，以解决现有商品定位识别技术中大量占用显存、识别速度较低、识别准确率难以控制的问题。为解决上述技术问题，本专利技术提供一种商品定位识别方法，包括：获取输入的待识别图像；将所述待识别图像输入至预先训练的神经网络模型中，提取出所述待识别图像中商品对应的区域；所述预先训练的神经网络模型为Faster-RCNN网络模型；截取所述商品对应的区域作为子图，输入至预先训练的图像分类神经网络模型；所述预先训练的图像分类神经网络模型为VGG-Net网络模型；由所述图像分类神经网络模型计算出所述子图属于各个商品类别的概率，识别出所述待识别图像中商品的类别。可选地，所述VGG-Net网络模型的训练过程包括：对经过标注商...

【技术保护点】
1.一种商品定位识别方法，其特征在于，包括：获取输入的待识别图像；将所述待识别图像输入至预先训练的神经网络模型中，提取出所述待识别图像中商品对应的区域；所述预先训练的神经网络模型为Faster‑RCNN网络模型；截取所述商品对应的区域作为子图，输入至预先训练的图像分类神经网络模型；所述预先训练的图像分类神经网络模型为VGG‑Net网络模型；由所述图像分类神经网络模型计算出所述子图属于各个商品类别的概率，识别出所述待识别图像中商品的类别。

【技术特征摘要】
1.一种商品定位识别方法，其特征在于，包括：获取输入的待识别图像；将所述待识别图像输入至预先训练的神经网络模型中，提取出所述待识别图像中商品对应的区域；所述预先训练的神经网络模型为Faster-RCNN网络模型；截取所述商品对应的区域作为子图，输入至预先训练的图像分类神经网络模型；所述预先训练的图像分类神经网络模型为VGG-Net网络模型；由所述图像分类神经网络模型计算出所述子图属于各个商品类别的概率，识别出所述待识别图像中商品的类别。2.如权利要求1所述的商品定位识别方法，其特征在于，所述VGG-Net网络模型的训练过程包括：对经过标注商品的训练样本图像进行预处理，输入至所述VGG-Net网络模型，加入已知的类别标签，用交叉熵作为损失函数，用随机梯度下降的方式计算反向传播梯度，用梯度优化网络参数，直到损失趋近于0。3.如权利要求2所述的商品定位识别方法，其特征在于，所述预先训练的神经网络模型为采用inception-v2作为基础的Faster-RCNN网络模型，所述Faster-RCNN网络模型的训练过程包括：将训练样本图像输入到所述Faster-RCNN网络模型中，由RPN预测的边框与已知的标注边框产生边框Smooth函数损失，由RPN预测的类别与已知的标注类别产生类别交叉熵损失，在全连接层与精修后的边框与类别产生第二次损失，使用随机梯度下降的方式优化损失，在优化过程中，第二步的损失所产生的梯度会被阻断在RPN层之后，不断对RPN及RPN层之前的网络参数进行优化。4.如权利要求3所述的商品定位识别方法，其特征在于，采用tensorflow中冻结模型的模型为pb文件的方式来联合所述VGG-Net网络模型与所述Faster-RCNN网络模型。5.如权利要求2至4任一项所述的商品定位识别方法，其特征在于，所述训练样本图像的生成过程包括：将人工进行商品mask区域标注的图像作为训练图像，输入至DeepLab网络进行训练；采用训练好的DeepLab网络对样本图像进...

【专利技术属性】
技术研发人员：陈志明，梁瀚君，冯新宇，
申请(专利权)人：广州逗号智能零售有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人