The invention proposes a supermarket commodity target recognition method based on in-depth learning, which solves the problem of low recognition rate of existing technology in real supermarket scenes. Its realization scheme is: 1) making supermarket shelf commodity training set; 2) building commodity detection network and training on the training set; 3) inputting the shelf picture into the trained network model to get all commodity target areas in the picture; 4) taking the output of the last convolution layer in the network model as the special commodity target. Characterization; 5) Coding the commodity characteristics to get the commodity descriptor; 6) Computing the similarity between the commodity descriptor and the commodity model descriptor in the existing model base; 7) Taking the most similar commodity model as the recognition result. The invention can accurately detect the commodity target area in the shelf picture, and can correctly identify the commodity target, and can be used for supermarket shelf commodity management.
【技术实现步骤摘要】
基于深度学习的超市商品识别方法
本专利技术属于图像处理
,特别涉及一种货架商品目标识别方法,可应用于超市货架商品管理。
技术介绍
在超市中,商家以及消费者需要实时地获得货架上的商品相关信息。目前这些商品的相关信息都是通过人工获得,但是超市的商品数目巨大,人工获得商品信息的方式成本高并且效率低,因此基于视觉的商品识别方法具有重要的研究意义和商业价值。超市商品识别的核心是目标检测和识别,ShaoqingRen等人在其发表的论文“FasterR-CNN:TowardsReal-TimeObjectDetectionwithRegionProposalNetworks”(IEEETransactionsonPatternAnalysis&MachineIntelligence,2015,39(6):1137-1149)中提出了一种基于深度学习的目标检测和识别方法。该方法首先通过区域生成网络得到图像中的目标候选区域;然后利用卷积神经网络提取候选区域的特征向量,对得到的特征向量进行感兴趣区域ROI池化,将池化后的特征与全连接层相连,通过分类器对目标进行识别;最后再利用边界框回归对目标区域的位置进行精修。该方法能够自适应地得到目标的高级语义特征,准确检测出目标区域位置,识别精度高。但是该方法仍不能应用于超市货架商品识别,其原因是:1、该方法对候选区域的特征向量进行感兴趣区域ROI池化时会导致较多目标的信息损失,当货架商品尺寸较小时,识别精度就会降低;2、该方法是基于统计的识别方法,超市时常会有新的商品出现,旧的商品淘汰,因此需要不断地重新训练分类器,不能满 ...
【技术保护点】
1.一种基于深度学习的超市商品识别方法,包括如下步骤:(1)制作训练样本集:(1a)在各大超市通过移动设备采集3000张包含不同商品的货架图片;(1b)手工标注货架图片中所有商品目标窗口以及类别,商品目标区域用窗口左上角顶点和右下角顶点的两个坐标表示,即(x1,y1,x2,y2),根据形状和用途对商品目标分类;(1c)随机打乱货架图片顺序,从中选取2500张图片作为训练样本集,500张图片作为测试样本集;(2)网络模型训练:(2a)构建商品检测网络模型,将训练样本集图片作为网络的输入样本,将商品目标区域坐标以及商品的类别作为输出样本;(2b)利用反向传播BP算法交替优化(2a)模型中的区域生成网络以及分类网络,更新网络参数,得到训练好的区域生成网络和分类网络;(3)提取商品目标区域及特征:(3a)将货架图片输入到(2b)训练好的区域生成网络中,得到商品目标区域坐标(x1,y1,x2,y2),并通过(2b)训练好的分类网络确定商品类别;(3b)将输入图片在商品检测网络模型的第十三个卷积层输出作为整个货架图片的特征表示;(3c)根据(3a)得到的目标区域坐标,在(3b)特征图上截取
【技术特征摘要】
1.一种基于深度学习的超市商品识别方法,包括如下步骤:(1)制作训练样本集:(1a)在各大超市通过移动设备采集3000张包含不同商品的货架图片;(1b)手工标注货架图片中所有商品目标窗口以及类别,商品目标区域用窗口左上角顶点和右下角顶点的两个坐标表示,即(x1,y1,x2,y2),根据形状和用途对商品目标分类;(1c)随机打乱货架图片顺序,从中选取2500张图片作为训练样本集,500张图片作为测试样本集;(2)网络模型训练:(2a)构建商品检测网络模型,将训练样本集图片作为网络的输入样本,将商品目标区域坐标以及商品的类别作为输出样本;(2b)利用反向传播BP算法交替优化(2a)模型中的区域生成网络以及分类网络,更新网络参数,得到训练好的区域生成网络和分类网络;(3)提取商品目标区域及特征:(3a)将货架图片输入到(2b)训练好的区域生成网络中,得到商品目标区域坐标(x1,y1,x2,y2),并通过(2b)训练好的分类网络确定商品类别;(3b)将输入图片在商品检测网络模型的第十三个卷积层输出作为整个货架图片的特征表示;(3c)根据(3a)得到的目标区域坐标,在(3b)特征图上截取区域,作为商品目标的特征表示;(4)采用高斯混合模型对(3c)商品目标的特征构建码本,用期望最大化EM算法对高斯混合模型的参数进行估计,得到目标商品的FisherVector描述子;(5)匹配识别商品目标:(5a)假设物体模型库中有N个描述子,计算(4)中得到的目标商品FisherVector描述子与相同类别商品模型库中的所有描述子的余弦距离:其中Li表示目标商品的FisherVector描述子与商品模型库第i个FisherVector描述子的余弦距离,是目标商品的FisherVector描述子,是商品模型库中的FisherVector描述子,||x||是的模,||y||是的模,“·”表示向量的内积。(5b)将(5a)计算的余弦距离值从大到小排序,选取与商品目标余弦距离最大的商品模型作为识别结果。2.根据权利要求1所述的方法,其中步骤(2a)中的商品检测网络模型,其结构自下而上为:输入层→第一个卷积层→第二个卷积层→第一个池化层→第三个卷积层→第四个卷积层→第二个池化层→第五个卷积层→第六个卷积层→第七个卷积层→第三个池化层→第八个卷积层→第九个卷积层→第十个卷积层→第四个池化层→第十一个卷积层→第十二个卷积层→第十三个卷积层→第一个上采样层→区域生成网络分类回归层→感兴趣区域ROI池化层→第一个全连接层→第二个全连接层→分类回归层。3.根据权利要求1所述的方法,其中步骤(2b)中利用反向传播BP算法交...
【专利技术属性】
技术研发人员:董伟生,蒋剑锋,石光明,袁鹏,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。