一种基于深度学习的图片背景清晰度检测方法技术

技术编号:13460355 阅读:101 留言:0更新日期:2016-08-04 10:20
本发明专利技术公开了一种基于深度学习的图片背景清晰度检测方法,该方法是利用卷积神经网络(CNN)进行特征提取,利用CNN提取的特征有效地将图片按照其背景清晰程度进行分类;同时利用迁移学习的方法,用拥有大量已知标记的ImageNet图片集进行预训练,解决了样本图片集中已知背景清晰度值图片较少的缺陷,从而获得较好的CNN参数;进一步利用少量的已知背景清晰度值的样本图片,对参数进行调整,使CNN参数适应待检测图片集;得到调整好的CNN参数就可以进行待检测图片的背景清晰度检测。本发明专利技术的检测方法,使得背景清晰度检测能够达到高度的精确性。

【技术实现步骤摘要】

本专利技术涉及一种基于深度学习的图片背景清晰度检测方法,主要关于机器学习中深度学习的应用,属于人工智能图片识别

技术介绍
深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示(属性类别或特征),以发现数据的分布式特征表示。BP算法作为传统训练多层网络的典型算法,实际上对于仅含几层网络,该训练方法就已很不理想。深度结构(涉及多个非线性处理单元层)非凸目标代价函数中普遍存在的局部最小是训练困难的主要来源。当前多数分类、回归等学习方法为浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约。深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达。通过足够多的转换的组合,非常复杂的函数也可以被学习。深度学习的核心方面是,上述各层的特征都不是利用人工工程来设计的,而是使用一种通用的学习过程从数据中学到的。Lecun等人提出的卷积神经网络(CNNs)是第一个真正多层结构学习算法,而本发明所用到的核心知识就是卷积神经网络,它利用空间相对关系减少参数数目以提高BP训练性能。卷积神经网络在图像识别领域取得很好的效果,在识别手写字符上达到了很好的效果。但其网络结构对图像识别的效果和效率有较大的影响,为改善识别性能,通过重复使用较小卷积核,设计并实现一种新的卷积神经网络结构,有效地减少训练参数的数量,并能够提高识别的准确率。卷积神经网络算法与图像识别领域当前具有世界先进水平的ILSVRC挑战赛中取得较好成绩的算法对比实验,验证这种结构的有效性。卷积神经网络的训练过程,需要大量的已知标记的样本,如果含标记的样本量不够,就容易造成系统的过度拟合。JeffDonahue等人构建了Decaf框架,其思想就是首先在含有大量已知标记样本的图片集中进行预训练,调整卷积神经网络系统的参数,利用迁移学习将整个系统的参数迁移到要训练的图片集中,这样只需要少量的已知标记的样本,就能够得到准确的分类。目前利用深度学习图片识别的种类有很多,例如手写字符,车牌号等,但是基于卷积神经网络的用法并没有开发完全,目前并没有人工智能识别图片中环境可见程度的好方法,图片背景的可见程度,即背景中事物的模糊程度,目前大部分图片识别的过程都是识别图片中的物体,往往忽略了其背景环境中有用的信息。本专利技术主要就是用于解决这个问题。识别图片背景的可见程度的实用性很大,比如利用本专利在现实中根据图片识别雾霾的等级,其应用前景很广阔。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于深度学习的图片背景清晰度检测方法,检测图片中背景清晰程度,即背景中事物的模糊程度,提取背景环境中有用的信息,为图片识别提供参考。本专利技术为解决上述技术问题采用以下技术方案:一种基于深度学习的图片背景清晰度检测方法,包括如下步骤:步骤1,将图片库ImageNet中已知标记的图片以及未在图片库ImageNet中但已知背景清晰度值的样本图片,均转换成像素为256*256的灰度图片;步骤2,对图片库ImageNet中转换后的灰度图片进行预训练,利用卷积神经网络提取所有灰度图片的特征并进行分类,计算损失函数,用随机梯度下降法调整卷积参数,使函数损失在预定范围内,得到初步调整后的卷积参数;步骤3,对未在图片库ImageNet中但已知背景清晰度值的样本图片转换后的灰度图片,基于步骤2初步调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到其清晰度值,与实际清晰度值作对比,计算损失函数,用随机梯度下降法继续调整卷积参数,使函数损失在预定范围内,得到最终调整后的卷积参数;步骤4,将待检测清晰度的图片转换成像素为256*256的灰度图片,基于步骤3最终调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到待检测清晰度图片的清晰度值。作为本专利技术的一个优选方案,所述卷积神经网络包括依次由输入到输出的输入层、第一卷积层、第一向下采样层、第二卷积层、第二向下采样层、全连接层、输出层,且除输入层、输出层外,第一卷积层、第一向下采样层、第二卷积层、第二向下采样层、全连接层在卷积神经网络所在层数分别为1、2、3、4、5层。作为本专利技术的一个优选方案,所述第一卷积层的卷积过程公式为:其中,l=1,xl表示经第一卷积层卷积后输出的像素点的值,表示输入层中第i行j列像素点的值,w为卷积参数,b为偏移量。作为本专利技术的一个优选方案,所述第一向下采样层的向下采样过程公式为:其中,l=2,xl表示经第一向下采样层采样后输出的像素点的值,表示第一卷积层中第i行j列像素点的值,β为向下采样参数,b为偏移量。作为本专利技术的一个优选方案,所述全连接层包括两次全连接过程,且全连接过程公式为:其中,第一次全连接时l=5,第二次全连接时l=6,xl表示经全连接后输出的像素点的值,k表示像素点编号,第一次全连接时k=1,…,576,第二次全连接时k=1,…,50,为权重值。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:1、本专利技术基于深度学习的图片背景清晰度检测方法,在样本图片不足的情况下,利用迁移学习的思想,首先在含有大量已知标记的ImageNet图片集中进行预训练,获得CNN参数,并进一步对CNN参数进行调整,使之适应待检测图片集,从而使待检测图片集的检测精确性更高。2、本专利技术基于深度学习的图片背景清晰度检测方法,解决了图片中背景清晰程度检测的问题,对实际应用中如识别雾霾等级、空气质量等方面有很大的作用。附图说明图1是本专利技术基于深度学习的图片背景清晰度检测方法的整体架构图。图2是本专利技术基于深度学习的图片背景清晰度检测方法的流程图。图3是本专利技术中卷积神经网络的内部结构图。具体实施方式下面详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。由于给定的一张图片,其像素并不确定,而卷积神经网络中的输入图片像素要求是固定的,所以首先要对图片进行预处理,将其转换成相同像素的图片,并且已知对ImageNet训练的过程中是将图片全部转换成256*256像素的图片进行处理,故输入的图片...

【技术保护点】
一种基于深度学习的图片背景清晰度检测方法,其特征在于,包括如下步骤:步骤1,将图片库ImageNet中已知标记的图片以及未在图片库ImageNet中但已知背景清晰度值的样本图片,均转换成像素为256*256的灰度图片;步骤2,对图片库ImageNet中转换后的灰度图片进行预训练,利用卷积神经网络提取所有灰度图片的特征并进行分类,计算损失函数,用随机梯度下降法调整卷积参数,使函数损失在预定范围内,得到初步调整后的卷积参数;步骤3,对未在图片库ImageNet中但已知背景清晰度值的样本图片转换后的灰度图片,基于步骤2初步调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到其清晰度值,与实际清晰度值作对比,计算损失函数,用随机梯度下降法继续调整卷积参数,使函数损失在预定范围内,得到最终调整后的卷积参数;步骤4,将待检测清晰度的图片转换成像素为256*256的灰度图片,基于步骤3最终调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到待检测清晰度图片的清晰度值。

【技术特征摘要】
1.一种基于深度学习的图片背景清晰度检测方法,其特征在于,包括如下步骤:
步骤1,将图片库ImageNet中已知标记的图片以及未在图片库ImageNet中但已知背景
清晰度值的样本图片,均转换成像素为256*256的灰度图片;
步骤2,对图片库ImageNet中转换后的灰度图片进行预训练,利用卷积神经网络提取所
有灰度图片的特征并进行分类,计算损失函数,用随机梯度下降法调整卷积参数,使函数损
失在预定范围内,得到初步调整后的卷积参数;
步骤3,对未在图片库ImageNet中但已知背景清晰度值的样本图片转换后的灰度图片,
基于步骤2初步调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到其清晰度
值,与实际清晰度值作对比,计算损失函数,用随机梯度下降法继续调整卷积参数,使函数
损失在预定范围内,得到最终调整后的卷积参数;
步骤4,将待检测清晰度的图片转换成像素为256*256的灰度图片,基于步骤3最终调整
后的卷积参数,利用卷积神经网络提取特征并进行分类,得到待检测清晰度图片的清晰度
值。
2.根据权利要求1所述基于深度学习的图片背景清晰度检测方法,其特征在于,所述卷
积神经网络包括依次由输入到输出的输入层、第一卷积层、第一向下采样层、第二卷积层、
第二向下采样层、全连接层、输出层,且除输入层、输出层外,第一卷积层、第一向下采样层、
第二卷积层、第二向下采样层、全连接层在卷积神经网络所在层数分别为1、2、3、4、5层。
3.根据权利要求2所述基于深度学习的图片背景清晰度检测方法,其特征在于,所述第
一卷积层的卷积过程公式为:
x l = f ( Σ i = 1 9 Σ j = 1 9 ( x i j l - 1 × w ...

【专利技术属性】
技术研发人员:胡海峰韩硕吴建盛
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1