The present invention provides a method for detecting food, which comprises the following steps: 1) image input to be detected; 2) image feature extraction using convolutional neural network training in advance; 3) with each feature map elements in the original image corresponding to the position as the center, proposed area; 4) to judge whether the area is the object according to the feature vector for each region corresponding to the center of the proposal; 5) if the proposed area is the object, is the feature extraction of the region using SPPNET regression; 6) according to the regional characteristics, the more accurate calculation of the bounding box, at the same time to determine whether the area for food. The method of the invention can effectively reduce the error rate of output and obtain better use experience.
【技术实现步骤摘要】
一种菜品检测方法
本专利技术属于计算机图像处理领域,具体来说涉及一种快速检测图像中的菜品区域的技术。
技术介绍
在使用图像识别菜品种类的任务中,通常识别系统的返回结果只限定于菜品种类,并且局限于菜品这一大类,对于并不包含菜品的图片其返回结果也仅限于识别程序所包含的种类。如果提交给识别系统的图像并不包含菜品,系统并不能对图像是否包含菜品做出判断,仍会返回最有可能的菜品种类,从而产生错误的结果。
技术实现思路
因此,本专利技术提供一种从图像中检测菜品所在区域的方案,可检测出图像中包含的一个或多个菜品,并分别给出每个菜品所在区域的左上角坐标x,y以及宽度w和高度h,在图像中不包含菜品的情况下则无返回结果。具体来说,本专利技术采用了以下技术方案:一种菜品检测方法,其特征在于,所述方法包括以下步骤:1)输入待检测的图像;2)使用预先训练的卷积神经网络提取图像特征;3)以特征图中每个元素在原图中对应位置为中心,给出提议区域;4)根据每个提议区域中心对应的特征向量判断该区域是否为物体;5)如果提议区域是物体,则使用SPPNET提取该区域的特征;6)根据区域特征做回归,计算更准确的boundingbox,同时判断该区域是否为菜品。在以上方法中,步骤2)提取图像特征的步骤包括:首先将待检测图像转换为224*224像素作为特征提取网络的输入,然后做5层卷积,每层卷积核分别为7*7、5*5、3*3、3*3、3*3,并且对每层提取的特征图的局部区域做最大值池化,得到大小为51*39,每个位置256维的特征图,该256维向量即为该位置对应原图局部区域的特征向量。进一步,步骤3)给出提议 ...
【技术保护点】
一种菜品检测方法,其特征在于,所述方法包括以下步骤:1)输入待检测的图像;2)使用预先训练的卷积神经网络提取图像特征;3)以特征图中每个元素在原图中对应位置为中心,给出提议区域;4)根据每个提议区域中心对应的特征向量判断该区域是否为物体;5)如果提议区域是物体,则使用SPPNET提取该区域的特征;6)根据区域特征做回归,计算更准确的bounding box,同时判断该区域是否为菜品。
【技术特征摘要】
1.一种菜品检测方法,其特征在于,所述方法包括以下步骤:1)输入待检测的图像;2)使用预先训练的卷积神经网络提取图像特征;3)以特征图中每个元素在原图中对应位置为中心,给出提议区域;4)根据每个提议区域中心对应的特征向量判断该区域是否为物体;5)如果提议区域是物体,则使用SPPNET提取该区域的特征;6)根据区域特征做回归,计算更准确的boundingbox,同时判断该区域是否为菜品。2.如权利要求1所述的菜品检测方法,其特征在于,步骤2)提取图像特征的步骤包括:首先将待检测图像转换为224*224像素作为特征提取网络的输入,然后做5层卷积,每层卷积核分别为7*7、5*5、3*3、3*3、3*3,并且对每层提取的特征图的局部区域做最大值池化,得到大小为51*39,每个位置256维的特征图,该256维向量即为该位置对应原图局部区域的特征向量。3.如权利要求2所述的菜品检测方法,其特征在于,步骤3)给出提议区域的步骤包括:以特征图中每个元素在原图中的对应位置为中心,以原图大小为1000*600为标准,给出三种尺度128、256、512,三种比例1:1、1:2、2:1...
【专利技术属性】
技术研发人员:吴斌,欧烈川,刘潇,
申请(专利权)人:南京江南博睿高新技术研究院有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。