一种多尺度融合的食品图像分类模型训练及图像分类方法技术

技术编号：24355279 阅读：254 留言：0更新日期：2020-06-03 02:25

本发明专利技术提供一种训练食品图像分类模型的方法，所述方法包括：对食品图像进行多尺度切割，形成包含原图像的多尺度食品切割图像；分别构建多个尺度的卷积神经网络模型，每个卷积神经网络模型对应一个尺度的食品切割图像；利用带有类别标签的食品图像作为目标图像，将其多尺度切割后代入多个尺度的卷积神经网络模型，利用预测的类别概率与真实的类别标签的比对结果作为反馈来进行多个尺度的卷积神经网络模型的优化。本发明专利技术创新性地提出了在原图像基础上进行多尺度切割形成多尺度切片的方式题。本发明专利技术在多个公共数据集都达到目前最好的识别性能：本发明专利技术的方法在公共数据集ETH Food‑101上可以达到90.56％的识别准确率，在公共数据集VireoFood‑172上可以达到90.61％的识别准确率。

A multi-scale fusion method for food image classification model training and image classification

全部详细技术资料下载

【技术实现步骤摘要】
一种多尺度融合的食品图像分类模型训练及图像分类方法
本专利技术图像识别领域，尤其涉及基于深度神经网络融合的食品图像识别模型训练及相应识别方法。
技术介绍
在食品图像识别领域，现有的技术大多是用将简单的识别方法用于一种装置，即只是作为识别设备(比如智能冰箱)的一个模块，而没有针对食物图像识别方法进行专门深入的改善。这类技术偏实用，主要实现方案是：(1)食物图像获取和处理；(2)训练模型以提取特征；(3)嵌入装置识别模块，进行实际识别。第(1)种方案用于对小数量的食品区域进行标注(比如，参见申请号为CN201810620629.4的中国专利“一种自动检测食物新鲜度的智能冰箱”)等处理，不适用于现实中大量无标注的食品图像。第(2)种方案所使用的模型比较传统，不是现在识别性能较好的深度神经网络模型(比如，参见申请号为CN201810736434.6的中国专利“一种计算图像中食物热量的方法及装置”)。第(3)种方案识别的数量有限(比如，参见申请号为CN201810038061.5的中国专利申请“一种基于卷积神经网络的中餐食物识别方法”...

【技术保护点】
1.一种训练食品图像分类模型的方法，其特征在于，所述方法包括：/n步骤(1)、对带有类别标签的食品图像分别进行多尺度切割，形成包含原图像的多个尺度的食品图像；/n步骤(2)、分别构建多个尺度的卷积神经网络模型，每个卷积神经网络模型对应一个尺度的食品图像；/n步骤(3)、利用所述带有类别标签的食品图像及其多个尺度的食品图像作为训练数据，分别代入多个尺度的卷积神经网络模型进行特征提取；以及/n步骤(4)、将所提取的多个尺度的食品图像的特征进行融合，基于融合特征对所述食品图像的类别进行预测并与相应标签进行比对，基于比对结果对所述多个尺度的卷积神经网络模型进行训练。/n

【技术特征摘要】
1.一种训练食品图像分类模型的方法，其特征在于，所述方法包括：
步骤(1)、对带有类别标签的食品图像分别进行多尺度切割，形成包含原图像的多个尺度的食品图像；
步骤(2)、分别构建多个尺度的卷积神经网络模型，每个卷积神经网络模型对应一个尺度的食品图像；
步骤(3)、利用所述带有类别标签的食品图像及其多个尺度的食品图像作为训练数据，分别代入多个尺度的卷积神经网络模型进行特征提取；以及
步骤(4)、将所提取的多个尺度的食品图像的特征进行融合，基于融合特征对所述食品图像的类别进行预测并与相应标签进行比对，基于比对结果对所述多个尺度的卷积神经网络模型进行训练。

2.根据权利要求1所述的方法，其特征在于，
所述步骤(4)还包括利用预测的类别概率与真实的类别标签的交叉熵函数来进行卷积神经网络模型的优化。

3.根据权利要求1所述的方法，其特征在于，所述步骤(3)还包括提取出每张图片的最后一个池化层特征和最后一个全连接层的特征。

4.根据权利要求3所述的方法，其特征在于，所述步骤(3)还包括对原图像的特征进行正则化操作，对切割图像的特征进行最...

【专利技术属性】
技术研发人员：蒋树强，罗正东，闵巍庆，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人