一种训练食品图像分类模型的方法及图像分类方法技术

技术编号:23892326 阅读:223 留言:0更新日期:2020-04-22 06:58
本发明专利技术提供一种训练食品图像分类模型的方法及图像分类方法,所述方法包括:分别构建多尺度的食品原材料神经网络以及多尺度的食品类别神经网络,对目标图像进行多尺度划分;对于目标图像的每种类型特征,分别进行多尺度融合,对于融合后的三种类型特征进行融合;将融合后的特征输入到基于融合特征的分类器进行分类。本发明专利技术创新性地提出了高级食品语义分布和深度视觉特征的互补性融合,并且进一步将原材料属性信息与高级食品语义分布和深度视觉特征进行融合,解决了食品图像的非刚性结构和几何变形问题,更加有利于食品图像的识别。并且,本发明专利技术通过多尺度融合方式,弥补了食品图像不具备空间排列特性的缺陷,最大限度地提高了分类性能。

【技术实现步骤摘要】
一种训练食品图像分类模型的方法及图像分类方法
本专利技术涉及图像识别领域,尤其涉及食品图像分类。
技术介绍
食品是人们生活的物质基础,良好的饮食习惯可以预防各种慢性疾病(如肥胖、糖尿病等)。食品图像分类又有着广泛的实际运用,比如智能手环来分析你的饮食营养、智慧餐厅自助结账等。但是食品图像分类也存在一定的难点:(1)在现实生活中,食品图像包含与食品无关的背景信息;(2)同一类别中的食品图像可能具有明显的差异性,而它们却和不同类别的相似;(3)食品图像没有任何独特的空间形状,也没有独特的外观,会随着烹饪的方法而改变,因此缺乏刚性结构。为了解决以上问题,有些工作基于Faster-R-CNN提取显著性区域后进行食品图像的分类(参见梅舒欢,闵巍庆,刘林虎等人发表于南京信息工程大学学报(自然科学版),2017(06):73-79的“基于FasterR-CNN的食品图像检索和分类”)。这种方法有效的去除了复杂的背景信息,捕捉到食品主体显著性区域,从而提升分类性能;有些研究工作提出一个能够捕获食物垂直结构的技术框架(参见MartinelN,Fo本文档来自技高网...

【技术保护点】
1.一种训练食品图像分类模型的方法,其特征在于,所述方法包括:/n步骤(1)、分别构建多尺度的食品原材料神经网络以及多尺度的食品类别神经网络,所述食品类别神经网络包含基于融合特征的分类器;/n步骤(2)、以带有标签的训练图像作为目标图像,对所述食品原材料神经网络以及食品类别神经网络进行训练,其中对目标图像进行多尺度划分,对于每个尺度利用所述食品原材料神经网络获得预测的原材料概率分布作为第一类特征,利用所述食品类别神经网络获取目标图像的类别概率分布特征和深度视觉特征,分别作为第二和第三类特征;/n步骤(3)、对于所述目标图像的每种类型特征,分别进行多尺度融合,对于融合后的三种类型特征进行融合;/...

【技术特征摘要】
1.一种训练食品图像分类模型的方法,其特征在于,所述方法包括:
步骤(1)、分别构建多尺度的食品原材料神经网络以及多尺度的食品类别神经网络,所述食品类别神经网络包含基于融合特征的分类器;
步骤(2)、以带有标签的训练图像作为目标图像,对所述食品原材料神经网络以及食品类别神经网络进行训练,其中对目标图像进行多尺度划分,对于每个尺度利用所述食品原材料神经网络获得预测的原材料概率分布作为第一类特征,利用所述食品类别神经网络获取目标图像的类别概率分布特征和深度视觉特征,分别作为第二和第三类特征;
步骤(3)、对于所述目标图像的每种类型特征,分别进行多尺度融合,对于融合后的三种类型特征进行融合;
步骤(4)、将融合后的特征输入到基于融合特征的分类器进行分类。


2.根据权利要求1所述的方法,其特征在于,所述深度视觉特征包括:所述类别神经网络输出层下层预定层数内的视觉特征。


3.根据权利要求1所述的方法,其特征在于,所述食品原材料神经网络和所述食品类别神经网络采用卷积神经网络,对所述食品原材料神经网络以及食品类别神经网络进行训练包括每一个尺度的图像,分别训练一个食品原材料神经网络模型以及食品类别神经网络模型。


4.根据权利要求1所述的方法,其特征在于,包括利用食品类别的预测概率与真实类别的交叉熵来优化所述食品类别神经网络:

以使得该交叉...

【专利技术属性】
技术研发人员:蒋树强刘林虎闵巍庆
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1