一种基于注意力机制的多属性图像美学评价系统技术方案

技术编号：20727226 阅读：48 留言：0更新日期：2019-03-30 18:13

本发明专利技术提出了一种基于注意力机制的多属性图像美学评价系统。利用机器学习的方法，使用大规模照片数据集和对应评论信息训练出一个复合神经网络模型，此模型能够利用卷积操作有效的提取出图像的多属性美学特征，在模型的多属性特征提取网络中对图像特征进行提取，在通道和空间注意力网络中对特征进行进一步处理，最后在语言生成网络中把这些不同属性的特征通过长短记忆网络单元生成最后的评论，此模型能够自动的根据图像特征模拟输出图像不同属性的评论。当输入一个图像的时候，此生成模型从不同属性考虑图像的特征，对图像的美学质量做出自然语言评价结果。该方法很容易通过软件实现，本发明专利技术可广泛应用推广到计算机视觉、图像评价等中。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制的多属性图像美学评价系统
本专利技术属于图像分析、计算机视觉领域，特别是图像美学质量评价，具体地说是基于注意力机制的多属性图像美学评价系统。
技术介绍
随着图像数据、视频数据等多媒体数据在大数据时代的普遍流行和日益频繁的处理传输，如何处理多媒体数据成为了学术与应用研究的热点和重点。图像美学质量评价就是计算机视觉，图像处理，图像美学等学科交叉形成的领域。图像美学质量评价(ImageAestheticQualityAssessment)旨在利用计算机模拟人类对美的感知与理解，自动评价图像的“美感”，即图像美学质量的客观化评价，主要针对拍摄或绘画的图像在构图、颜色、光影、景深、虚实等美学因素方面的效果形成的美感刺激。图像美学质量评价是一个最近十几年才开始引起研究人员关注的一个方向，从一开始就没有走基于规则的路线，而是直接遵循了据驱动的路线，因此图像美学质量评价基准数据集构建就成为了该方向研究的关键前提条件。在图像美学质量人工主观评价得分获取方面，目前主要分为实验室内的人工打分实验、在线图像分享、打分网站下载收、众包(crowdsourcing)评价方法。目前在图像、图形、视频3种主要的可视媒体中，图像美学评价的研究较多，可以将上述研究现状总结为几个任务：美感分类是指给定一幅图像，输出“好”和“不好”或者美学质量“高”或“低”2个类别；美感评分是给出图像的美学质量评分，表现为一个连续数值；美感分布是给出图像的美学质量分数分布直方图；美学因素是给出图像的光影、配色、构图、模糊、运动、趣味等多个方面的评价；美学描述给出图像美学方面的语言评论。传统的图...

【技术保护点】
1.一种基于注意力机制的多属性图像美学评价系统，其特征在于，包括：数据集采集和图像预处理模块、多属性特征神经网络模块、通道和空间注意力模块、语言生成模块；数据集采集模块：从摄影网站获取图像数据、图像打分和评论文本信息数据，并对获取的文本评论信息进行分类，构建出带属性信息的数据集；图像预处理模块：对于采集数据按9：1的比例划分训练集和测试集，对训练集中的样本图像进行预处理，所述预处理包括图像大小变换和图像归一化，得到一个图像像素大小一致的输入数据，送入多属性特征提取网络模块提取多属性特征；多属性特征神经网络模块：通过多任务分支结构对图像打分进行回归计算，得到图像的多属性特征向量，此模块得到的特征向量是对输入的特征提取，是对下一模块的初始处理；通道和空间注意力模块：对图像的多属性特征中不同的属性特征分别在通道和空间维度上，进行注意力权重动态分配操作，得到最后的多属性注意力特征；语言生成模块：将分类好的文本评论信息按类别送入长短时记忆单元LSTM中生成最后的对应文本评论分类属性的评价，长短时记忆单元LSTM同时调用多属性注意力特征，将这些特征和对应文本处理的向量进行编码，送入长短时记忆单元L...

【技术特征摘要】
1.一种基于注意力机制的多属性图像美学评价系统，其特征在于，包括：数据集采集和图像预处理模块、多属性特征神经网络模块、通道和空间注意力模块、语言生成模块；数据集采集模块：从摄影网站获取图像数据、图像打分和评论文本信息数据，并对获取的文本评论信息进行分类，构建出带属性信息的数据集；图像预处理模块：对于采集数据按9：1的比例划分训练集和测试集，对训练集中的样本图像进行预处理，所述预处理包括图像大小变换和图像归一化，得到一个图像像素大小一致的输入数据，送入多属性特征提取网络模块提取多属性特征；多属性特征神经网络模块：通过多任务分支结构对图像打分进行回归计算，得到图像的多属性特征向量，此模块得到的特征向量是对输入的特征提取，是对下一模块的初始处理；通道和空间注意力模块：对图像的多属性特征中不同的属性特征分别在通道和空间维度上，进行注意力权重动态分配操作，得到最后的多属性注意力特征；语言生成模块：将分类好的文本评论信息按类别送入长短时记忆单元LSTM中生成最后的对应文本评论分类属性的评价，长短时记忆单元LSTM同时调用多属性注意力特征，将这些特征和对应文本处理的向量进行编码，送入长短时记忆单元LSTM中产生最后的不同属性的评论结果。2.根据权利要求1所述的一种基于注意力机制的多属性图像美学评价系统，其特征在于：所述数据采集模块具体实现如下：(11)从网站获取到编号靠前的33万张图像，并且保存每个图像评论者的评论信息；(12)搜集专业的美学数据集，参考其中的分类标准，将评论分类为5个属性，分别为用色和用光评价，构图评价，景深和聚焦评价，印象和主题评价，相机技巧评价；(13)通过对专业数据集的词频排序，取前5的名词对文本评论进行筛选，如果评论中包含排名前5名词中的任意一个，则将该评论归为该类别，构建出带属性信息的数据集。3.根据权利要求1所述的一种基于注意力机制的多属性图像美学评价系统，其特征在于：所述图像预处理模块具体实现如下：(21)将整理后的训练集中的图像按照不同的属性根据预训练网络的结果制作标签数据；(22)标签对应图像也需要进行处理，将训练集中原始图像进行大小变换，将原始图像的像素大小变换到一个固定尺寸，这个固定尺寸和设计的深度卷积神经网络所...

【专利技术属性】
技术研发人员：金鑫，吴乐，章乐，赵耿，李晓东，周兴晖，孙红波，
申请(专利权)人：中共中央办公厅电子科技学院，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人