【技术实现步骤摘要】
本专利技术涉及一种基于深度学习的图片背景清晰度检测方法,主要关于机器学习中深度学习的应用,属于人工智能图片识别
技术介绍
深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示(属性类别或特征),以发现数据的分布式特征表示。BP算法作为传统训练多层网络的典型算法,实际上对于仅含几层网络,该训练方法就已很不理想。深度结构(涉及多个非线性处理单元层)非凸目标代价函数中普遍存在的局部最小是训练困难的主要来源。当前多数分类、回归等学习方法为浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约。深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达。通过足够多的转换的组合,非常复杂的函数也可以被学习。深度学习的核心方面是,上述各层的特征都不是利用人工工程来设计的,而是使用一种通用的学习过程从数据中学到的。Lecun等人提出的卷积神经网络(CNNs)是第一个真正多层结构学习算法,而本发明所用到的核心知识就是卷积神经网络,它利用空间相对关系减少参数数目以提高BP训练性能。卷积神经网络在图像识别
【技术保护点】
一种基于深度学习的图片背景清晰度检测方法,其特征在于,包括如下步骤:步骤1,将图片库ImageNet中已知标记的图片以及未在图片库ImageNet中但已知背景清晰度值的样本图片,均转换成像素为256*256的灰度图片;步骤2,对图片库ImageNet中转换后的灰度图片进行预训练,利用卷积神经网络提取所有灰度图片的特征并进行分类,计算损失函数,用随机梯度下降法调整卷积参数,使函数损失在预定范围内,得到初步调整后的卷积参数;步骤3,对未在图片库ImageNet中但已知背景清晰度值的样本图片转换后的灰度图片,基于步骤2初步调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到其清晰度值,与实际清晰度值作对比,计算损失函数,用随机梯度下降法继续调整卷积参数,使函数损失在预定范围内,得到最终调整后的卷积参数;步骤4,将待检测清晰度的图片转换成像素为256*256的灰度图片,基于步骤3最终调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到待检测清晰度图片的清晰度值。
【技术特征摘要】
1.一种基于深度学习的图片背景清晰度检测方法,其特征在于,包括如下步骤:
步骤1,将图片库ImageNet中已知标记的图片以及未在图片库ImageNet中但已知背景
清晰度值的样本图片,均转换成像素为256*256的灰度图片;
步骤2,对图片库ImageNet中转换后的灰度图片进行预训练,利用卷积神经网络提取所
有灰度图片的特征并进行分类,计算损失函数,用随机梯度下降法调整卷积参数,使函数损
失在预定范围内,得到初步调整后的卷积参数;
步骤3,对未在图片库ImageNet中但已知背景清晰度值的样本图片转换后的灰度图片,
基于步骤2初步调整后的卷积参数,利用卷积神经网络提取特征并进行分类,得到其清晰度
值,与实际清晰度值作对比,计算损失函数,用随机梯度下降法继续调整卷积参数,使函数
损失在预定范围内,得到最终调整后的卷积参数;
步骤4,将待检测清晰度的图片转换成像素为256*256的灰度图片,基于步骤3最终调整
后的卷积参数,利用卷积神经网络提取特征并进行分类,得到待检测清晰度图片的清晰度
值。
2.根据权利要求1所述基于深度学习的图片背景清晰度检测方法,其特征在于,所述卷
积神经网络包括依次由输入到输出的输入层、第一卷积层、第一向下采样层、第二卷积层、
第二向下采样层、全连接层、输出层,且除输入层、输出层外,第一卷积层、第一向下采样层、
第二卷积层、第二向下采样层、全连接层在卷积神经网络所在层数分别为1、2、3、4、5层。
3.根据权利要求2所述基于深度学习的图片背景清晰度检测方法,其特征在于,所述第
一卷积层的卷积过程公式为:
x l = f ( Σ i = 1 9 Σ j = 1 9 ( x i j l - 1 × w ...
【专利技术属性】
技术研发人员:胡海峰,韩硕,吴建盛,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。