一种基于深度学习的食物图像识别方法技术

技术编号：11500308 阅读：97 留言：0更新日期：2015-05-22 20:40

本发明专利技术提出了一种基于深度学习的食物图像识别方法，包括：食物图像数据库、深度学习网络和分类器；食物图像数据库的图像输入到深度学习网络，逐层计算后输出具有代表性的特征，包括图像的边缘特征组合，图像的基本形状特征组合，图像的色彩特征组合，分类器就是利用这些特征组合对图像进行分类。本发明专利技术充分发挥深度学习的自我学习优势，可以使用无标签图像数据进行非监督学习，当输入一幅图像时，能够快速准确的提取特征，进行逐层抽象直到形成某一食物的概念，并用分类器进行分类；而且，从任何角度拍摄获取的图像，得到的局部特征都几乎相同，这就解决了拍摄角度限制的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的食物图像识别方法
本专利技术涉及人工智能领域，特别涉及一种基于深度学习的食物图像识别方法。
技术介绍
S.Ysngetal.提出一种识别快餐食物的系统，能够识别肯德基、麦当劳中的快餐。但由于快餐的多样性，该系统准确率不高，加之，同样对摄相装置和图像位置有特定要求，操作较为繁琐。基于深度学习的人脸识别：利用深度学习的方式进行人脸识别，可应用于门禁系统、安检系统、情绪识别等，但由于应用的特殊性，难以在日常生活中推广。而且，上述传统的图像识别方法只提取图像的部分具有代表性的特征，比如SIFT和SURF，具有一定的局限性，某些过程还需要人工选取；人工神经网络容易过拟合，参数很难调整，训练比较慢，并且在层数较少时效果并不比其他方法更优。
技术实现思路
为解决现有技术中的缺点和不足，本专利技术提出一种基于深度学习的食物图像识别方法，将深度学习与食物图像识别相结合，采用逐层初始化的训练方式，充分发挥深度学习自我学习的优势，可以有效解决训练比较慢、训练难度大、参数很难调整的问题。本专利技术的技术方案是这样实现的：一种基于深度学习的食物图像识别方法，包括：食物图像数据库、深度学习网络和分类器；食物图像数据库的图像输入到深度学习网络，逐层计算后输出具有代表性的特征，用分类器对特征进行分类，得出分类结果。可选地，所述深度学习网络包括输入层、隐层和输出层，包括以下步骤：步骤(a)，输入层对输入的原始图像进行预处理，包括裁剪、缩放与分割；步骤(b)，隐层首先使用自下向上非监督学习，然后使用自顶向下监督学习；步骤(c)，输出层输出具有代表性的特征组合，包括图像的边缘特征...

【技术保护点】
一种基于深度学习的食物图像识别方法，其特征在于，包括：食物图像数据库、深度学习网络和分类器；食物图像数据库的图像输入到深度学习网络，逐层计算后输出具有代表性的特征，包括图像的边缘特征组合，图像的基本形状特征组合，图像的色彩特征组合，分类器就是利用这些特征组合对图像进行分类。

【技术特征摘要】
1.一种基于深度学习的食物图像识别方法，其特征在于，包括：食物图像数据库、深度学习网络和分类器；食物图像数据库的图像输入到深度学习网络，逐层计算后输出具有代表性的特征，包括图像的边缘特征组合，图像的基本形状特征组合，图像的色彩特征组合，分类器就是利用这些特征组合对图像进行分类；所述深度学习网络包括输入层、隐层和输出层，包括以下步骤：步骤(a)，输入层对输入的原始图像进行预处理，包括裁剪、缩放与分割；步骤(b)，隐层首先使用自下向上非监督学习，然后使用自顶向下监督学习；其中，隐层使用自下向上非监督学习的步骤，包括：步骤(b1)，由食物图像数据库随机抽取食物图像，采用无标签图像训练第一层，从而...

【专利技术属性】
技术研发人员：张卫山，赵德海，卢清华，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人