一种基于深度学习的食物图像识别方法技术

技术编号:11500308 阅读:97 留言:0更新日期:2015-05-22 20:40
本发明专利技术提出了一种基于深度学习的食物图像识别方法,包括:食物图像数据库、深度学习网络和分类器;食物图像数据库的图像输入到深度学习网络,逐层计算后输出具有代表性的特征,包括图像的边缘特征组合,图像的基本形状特征组合,图像的色彩特征组合,分类器就是利用这些特征组合对图像进行分类。本发明专利技术充分发挥深度学习的自我学习优势,可以使用无标签图像数据进行非监督学习,当输入一幅图像时,能够快速准确的提取特征,进行逐层抽象直到形成某一食物的概念,并用分类器进行分类;而且,从任何角度拍摄获取的图像,得到的局部特征都几乎相同,这就解决了拍摄角度限制的问题。

【技术实现步骤摘要】
一种基于深度学习的食物图像识别方法
本专利技术涉及人工智能领域,特别涉及一种基于深度学习的食物图像识别方法。
技术介绍
S.Ysngetal.提出一种识别快餐食物的系统,能够识别肯德基、麦当劳中的快餐。但由于快餐的多样性,该系统准确率不高,加之,同样对摄相装置和图像位置有特定要求,操作较为繁琐。基于深度学习的人脸识别:利用深度学习的方式进行人脸识别,可应用于门禁系统、安检系统、情绪识别等,但由于应用的特殊性,难以在日常生活中推广。而且,上述传统的图像识别方法只提取图像的部分具有代表性的特征,比如SIFT和SURF,具有一定的局限性,某些过程还需要人工选取;人工神经网络容易过拟合,参数很难调整,训练比较慢,并且在层数较少时效果并不比其他方法更优。
技术实现思路
为解决现有技术中的缺点和不足,本专利技术提出一种基于深度学习的食物图像识别方法,将深度学习与食物图像识别相结合,采用逐层初始化的训练方式,充分发挥深度学习自我学习的优势,可以有效解决训练比较慢、训练难度大、参数很难调整的问题。本专利技术的技术方案是这样实现的:一种基于深度学习的食物图像识别方法,包括:食物图像数据库、深度学习网络和分类器;食物图像数据库的图像输入到深度学习网络,逐层计算后输出具有代表性的特征,用分类器对特征进行分类,得出分类结果。可选地,所述深度学习网络包括输入层、隐层和输出层,包括以下步骤:步骤(a),输入层对输入的原始图像进行预处理,包括裁剪、缩放与分割;步骤(b),隐层首先使用自下向上非监督学习,然后使用自顶向下监督学习;步骤(c),输出层输出具有代表性的特征组合,包括图像的边缘特征组合,图像的基本形状特征组合,图像的色彩特征组合,用于后期分类。可选地,隐层使用自下向上非监督学习的步骤,具体包括:步骤(b1),由食物图像数据库随机抽取食物图像,采用无标签图像训练第一层,从而得到比输入更具表示能力的特征,这些特征以一定的比例相互叠加得到原图像;步骤(b2),在学习得到第n-1层后,将第n-1层的输出作为第n层的输入,训练第n层,由此分别得到各层的参数。可选地,隐层使用自下向上的非监督学习,具体过程为:对输入进行编码得到输出特征,再将输出特征进行反编码,与输入进行对比,调整编码与反编码参数使重构误差最小。可选地,隐层使用自顶向下监督学习的步骤,具体为:通过带标签的数据训练,误差自顶向下传输,对每一层的参数进行微调。本专利技术的有益效果是:(1)充分发挥深度学习的自我学习优势,机器自动学习良好的特征,可以使用无标签图像数据进行非监督学习,当输入一幅图像时,能够快速准确的提取特征,进行逐层抽象直到形成某一食物的概念,并用分类器进行分类,避免了人工选取的局限性,适应能力更强;(2)利用深度学习网络的结构特征,采取逐层初始化的训练机制,大大降低训练难度;(3)由于深度学习网络将图像分割后提取每一部分的特征,然后再将特征进行组合,而非直接比较整幅图像,从任何角度拍摄获取的图像,得到的局部特征都几乎相同,这就解决了拍摄角度限制的问题;(4)将深度学习与人们关注的健康饮食结合,更容易被认可与接受,提高研究价值。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于深度学习的食物图像识别方法的流程图;图2为本专利技术部分深度学习网络解析图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,本专利技术的基于深度学习的食物图像识别方法,包括:食物图像数据库、深度学习网络和分类器。食物图像数据库的图像输入到深度学习网络,逐层计算后输出具有代表性的特征,用分类器(例如SVM分类器)对特征进行分类,得出分类结果。其中,深度学习网络分为:输入层、隐层和输出层,包括以下步骤:步骤(a),原始图像输入到深度学习网络中,输入层对原始图像进行预处理,包括裁剪、缩放与分割,这一层的处理方便后续的特征提取与计算。步骤(b),隐层设置为5层,首先,使用自下向上非监督学习,然后,使用自顶向下监督学习。步骤(c),输出层输出具有代表性的特征组合,包括图像的边缘特征组合,图像的基本形状特征组合,图像的色彩特征组合,用于后期分类。使用自下向上非监督学习的步骤,具体包括:步骤(b1),由食物图像数据库随机抽取食物图像,采用无标签图像训练第一层,从而得到比输入更具表示能力的特征,这些特征以一定的比例相互叠加得到原图像;步骤(b2),在学习得到第n-1层后,将第n-1层的输出作为第n层的输入,训练第n层,由此分别得到各层的参数。其中,上述步骤(b2)中,参数调整的过程为:对输入进行编码得到输出特征,再将输出特征进行反编码,与输入进行对比,调整编码与反编码参数使重构误差最小。隐层使用自顶向下监督学习的步骤,具体包括:通过带标签的数据训练,误差自顶向下传输,对每一层的参数进行微调。图2为本专利技术中部分深度学习网络的解析图,由图2可以看出,输入层为显层,输入一副图片,进行预处理,包括剪裁、缩放、分割。隐层由许多限制玻尔兹曼机(RBF)组成,隐层中V1层提取图像的边缘成分,V2层是V1层边缘成分的组合,得到更高一层的基础形状成分,例如圆形、方形等,V3又是V2基础形状成分的组合,由此不断向上训练,在最后输出能够准确表示某一食物的特征组合。本专利技术的基于深度学习的食物图像识别方法,充分发挥深度学习的自我学习优势,可以使用无标签图像数据进行非监督学习,当输入一幅图像时,能够快速准确的提取特征,进行逐层抽象直到形成某一食物的概念,并用分类器进行分类。而且,由于深度学习网络将图像分割后提取每一部分的特征,然后再将特征进行组合,而非直接比较整幅图像,从任何角度拍摄获取的图像,得到的局部特征都几乎相同,这就解决了拍摄角度限制的问题。并且,食物图像的识别更关注人们的健康饮食,利于普遍推广,将两者结合具有很高的研究价值与应用前景。以上所述仅为本专利技术的较佳实施例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
一种基于深度学习的食物图像识别方法,其特征在于,包括:食物图像数据库、深度学习网络和分类器;食物图像数据库的图像输入到深度学习网络,逐层计算后输出具有代表性的特征,包括图像的边缘特征组合,图像的基本形状特征组合,图像的色彩特征组合,分类器就是利用这些特征组合对图像进行分类。

【技术特征摘要】
1.一种基于深度学习的食物图像识别方法,其特征在于,包括:食物图像数据库、深度学习网络和分类器;食物图像数据库的图像输入到深度学习网络,逐层计算后输出具有代表性的特征,包括图像的边缘特征组合,图像的基本形状特征组合,图像的色彩特征组合,分类器就是利用这些特征组合对图像进行分类;所述深度学习网络包括输入层、隐层和输出层,包括以下步骤:步骤(a),输入层对输入的原始图像进行预处理,包括裁剪、缩放与分割;步骤(b),隐层首先使用自下向上非监督学习,然后使用自顶向下监督学习;其中,隐层使用自下向上非监督学习的步骤,包括:步骤(b1),由食物图像数据库随机抽取食物图像,采用无标签图像训练第一层,从而...

【专利技术属性】
技术研发人员:张卫山赵德海卢清华
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1