【技术实现步骤摘要】
基于自监督学习与深度森林的摄影图像美学风格分类方法
[0001]本专利技术属于图像美学风格分类领域,涉及一种摄影图像美学风格分类方法,特别涉及一种基于自监督特征学习与深度森林的多标签摄影图像美学风格分类方法。
技术介绍
[0002]由于在摄影图像中,总是包含多种美学风格标签,因此多标签的摄影图像美学风格分类方法相比单标签更有实际意义,目的是为了把摄影图像所属的美学风格都预测出来。由于摄影图像包含多种美学风格标签,分类的结果组合数目相比单标签是指数级别的增长,多标签摄影图像美学风格分类问题难度更大、精度更低。
[0003]现有方法主要存在以下问题:现有的大规模数据集不适用于美学风格分类任务的特征学习,很难学习到对美学风格分类任务有价值的特征;多标签任务学习时不能充分利用标签之间的关联信息
技术实现思路
[0004]针对现有技术中存在的不足,本专利技术提供了一种基于自监督学习与深度森林的摄影图像美学风格分类方法,包含自监督特征学习模型和深度森林模型。利用大规模的美学图像对自监督特征学习模型进行训练,训练完 ...
【技术保护点】
【技术特征摘要】
1.基于自监督学习与深度森林的摄影图像美学风格分类方法,其特征在于,步骤如下:步骤1:构建并训练自监督特征学习模型;所述的自监督特征学习模型由特征提取网络与投影网络组成;步骤1
‑
1:建立特征提取网络;步骤1
‑
2:建立投影网络;步骤1
‑
3:建立自监督对比学习损失函数;步骤2:构建并训练深度森林模型,具体包括:步骤2
‑
1:数据集采用多标签摄影图像共2000张,总共有14个摄影美学风格,每张图像有大于1个的摄影美学风格标签;将这2000张图像通过步骤1中的自监督特征学习模型得到的特征向量按照列拼接得到输入矩阵;步骤2
‑
2:建立深度森林模型层次结构;步骤2
‑
3:建立深度森林模型层与层之间的连接方式;步骤3:通过训练好的特征提取网络和深度森林模型完成摄影图像美学风格分类。2.根据权利要求1所述的基于自监督学习与深度森林的摄影图像美学风格分类方法,其特征在于,步骤1具体方法如下:所述的自监督特征学习模型由特征提取网络与投影网络组成;步骤1
‑
1:建立特征提取网络;数据集采用AVA美学数据集共250000张美学图像,针对每个输入样本x,将ResNet50作为特征提取网络得到表征向量为特征提取网络得到表征向量进行归一化到超球面;步骤1
‑
2:建立投影网络;获得表征向量r后,通过投影网络获得向量投影网络为一个多层感知机网络,包括一个2048维度的隐层和一个D
P
=128的输出层;将向量z再次归一化到超球面;步骤1
‑
3:建立自监督对比学习损失函数;若给定容量为N的一批随机采样的数据/标签对{x
k
,y
k
}
k=1
…
N
,则对应用于训练的是经过数据增强(旋转,平移等)的一批数据容量为2N的数据/标签对其中和是x
k
分别经过两次不同数据增强生成的,且标签在同一批次训练数据中,任意选取i∈I≡1
…
2N索引的数据作为基准数据,则j(i)是与索引i的数据来源于同一个源数据样本进行数据增强得到的另一个数据索引;自监督对比学习损失函数公式如下:其中,符号
·
表示内积运算,表示温度系数,;j(i)索引的数据作为正样本,A(i)表示其余数据的集合作为负样本。
3.根据权利要求2所述的基于自监督学习与深度森林的摄影图像美学风格分类方法,其特征在于,步骤2具体...
【专利技术属性】
技术研发人员:张灵均,包尔权,张桦,吴以凡,苟若芸,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。