【技术实现步骤摘要】
一种基于图像显著性和迁移学习的图像场景分类方法
本专利技术涉及图像处理方法,具体涉及一种基于图像显著性和迁移学习结合的图像场景分类方法。
技术介绍
场景分类是计算机视觉领域重要的研究方向,场景图像的类间相似性和类内差异性使得场景分类极具挑战性。场景分类的核心在于对图像特征的提取。传统方法使用尺度不变特征变换SIFT、颜色直方图、方向梯度直方图HOG、局部二值模式LBP等直接对图像提取特征描述子,需要人为去设计符合目标识别的特征,耗费大量的人力。如果人工特征不能够抽象出本质完备的定义,又容易导致泛化性能不足的问题。而深度学习的方法摒弃了人为选择特征描述子,采用了训练深度网络模型的方式来对图像自动提取特征,一定程度上节省了人力。然而,为了得到泛化性能良好的深度学习网络模型,需要大量的数据进行训练,训练样本数据的不足给实际应用带来了困难;另一方面,图像数据量大,特别是高分辨率图像,场景可能复杂,但能引起人视觉注意的区域往往有限,如果直接用原图像进行场景分类计算,计算量巨大,浪费计算资源,运算时间长,复杂的特征也会扰 ...
【技术保护点】
1.一种基于图像显著性和迁移学习的图像场景分类方法,其特征在于,包括以下步骤:/n(1)提取不同场景的样本图像,将图像缩放后形成图像集;/n(2)提取图像集中每幅图像的显著性区域;/n(3)将步骤(2)得到的每幅图像的显著性区域的图像放大后构建显著性图像集,并将其按比例划分训练集和测试集;/n(4)基于通用的VGG16模型建立场景分类网络模型,进行迁移学习操作;/n(5)用步骤(3)中得到的训练集和测试集训练并测试步骤(4)搭建的网络;/n(6)用步骤(4)建立和步骤(5)训练得到的网络实施图像场景分类。/n
【技术特征摘要】
1.一种基于图像显著性和迁移学习的图像场景分类方法,其特征在于,包括以下步骤:
(1)提取不同场景的样本图像,将图像缩放后形成图像集;
(2)提取图像集中每幅图像的显著性区域;
(3)将步骤(2)得到的每幅图像的显著性区域的图像放大后构建显著性图像集,并将其按比例划分训练集和测试集;
(4)基于通用的VGG16模型建立场景分类网络模型,进行迁移学习操作;
(5)用步骤(3)中得到的训练集和测试集训练并测试步骤(4)搭建的网络;
(6)用步骤(4)建立和步骤(5)训练得到的网络实施图像场景分类。
2.根据权利要求1所述的一种基于图像显著性和迁移学习的图像场景分类方法,其特征在于,步骤(2)具体包括以下内容:
(2-1)建立图像坐标系,以图像左上角为坐标系原点,单位为像素;
(2-2)将图像划分为格子状初始候选区域;
(2-3)采用SelectiveSearch算法,根据颜色、纹理、大小和填充的相似度对步骤(2-2)得到的区域进行聚合操作,得到不相似的候选区域集合;
(2-4)采用滑动窗口机制搜索图像中物体密度最大区域位置;
(2-5)将滑动窗口处于物体密度最大区域位置的图像区域作为整幅图像的显著性区域。
3.根据权利要求2所述的一种基于图像显著性和迁移学习的图像场景分类方法,其特征在于,步骤(2-4)具体包括以下内容:
(2-4-1)确定滑动窗口尺寸;
(2-4-2)确定滑动窗口从原点开始移动滑动窗口,每次移动1像素,依次从左往右,从上至下移动,令m代表窗口移动的次数,m=1,2,…,M,M是窗口移动的总次数,m=1表示滑动窗口处于原点的位置,m=M表示滑动窗口处于图像最右下角的位置;
(2-4-3)定义图像区域物体密集度为滑动窗口区域内候选区域的面积与该图像全部候选区域面积和的比值,即:
Dm=Bm/A
式中,Dm表示滑动窗口第m次移动时窗口内的物体密集度,Bm表示滑动窗口第m次移动时窗口内候选区域的面积,A为图像全部候选区域集合的面积和;
(2-4-4)计算图像全部候选区域集合的面积和A,计算方法如下:
上式中,N是图像全部候选区域集合中候选区域的总数,Pn是第n个候选区域的面积,其计算方法如下:
Pn=(x2-x1)*(y2-y1)
上式中,(x1,y1)和(x2,y2)为第n个候选区域的两个对角点坐标,单位为像素;
(2-4-5)计算滑动窗口在每个位置的物体密集度Dm,方法如下:
(a)计算滑动窗口内候选区域的面积Bm:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。