当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于PAD的影像情感标注的方法技术

技术编号:33633308 阅读:7 留言:0更新日期:2022-06-02 01:41
本发明专利技术提供了一种基于PAD的影像情感标注的方法,包括以下步骤:步骤1,收集情感词语构建情感词语集合,评定并计算情感词语集合中的每个情感词语在PAD空间的空间坐标值;步骤2,设计图像来表达对应的情感词语,并根据图像构建图像库,为每个图像选择最贴切的第一情感词语并进行初次验证;步骤3,评定并计算影像库中的每个图像在PAD空间的坐标值的平均值,得到每个图像基于PAD空间的空间坐标值;步骤4,对图像与情感词语集合中的情感词语在PAD空间中的欧式距离进行计算,根据欧式距离对图像选择的第一情感词语进行二次验证;步骤5,二次验证通过后,将第一情感词语作为情感标签为对应的图像进行标注。图像进行标注。图像进行标注。

【技术实现步骤摘要】
一种基于PAD的影像情感标注的方法


[0001]本专利技术属于数据分析
,具体涉及一种基于PAD的影像情感标注的方法。

技术介绍

[0002]随着近年来计算机技术在图像及语音处理方面的快速发展,情感计算已成为人机交互方面的一个研究热点。大量的影像数据携带了情感信息,如何有效表示和描述图像的情感,并且给予量化,成为影像标注与检索领域的一个重要且有挑战性的课题。影像情感标注作为一种特殊的影像分类技术,无论是技术方向还是应用方向都还处在不断探索中。不同于文本情感分析,影像中的情感是隐藏的,是一种高级语义情感理解,面对互联网中大量的图片以及视频信息,需要更有效的方法完成影像特征的抽取、情感判别与分类。
[0003]现有的图片情感标注技术主要分为两类:传统图片情感分析和深度学习。
[0004]传统图片情感分析的一个重要内容是对视觉特征的提取,这需要从底层、中层或高层分别进行提取。底层特征的提取需要对图片内容中的“颜色”“纹理”“构图”“内容”等视觉特征进行提取,这是一个不断提高判别准确率的过程。仅从图像底层视觉特征进行情感分析是不可靠的,和人类感知存在一定的偏差,相同的图像可能会在不同的对象或不同的时间产生不同的情感,即底层视觉特征与高层人类感知存在鸿沟。目前多数中高层特征的研究主要针对人类的脸部特征,如在面部表情情感分析中将照明、姿势、面部尺寸和面部标准误差作为高层特征进行分析。这种方式情感标注方式过程上比较繁琐。
[0005]深度学习的方法在于构建精确的算法,以及提高算法的准确率,且需要大量的数据集作为前期训练,因此前期准确率会比较低下。例如,CNN模型具有容易出现梯度消散问题、空间关系辨识度差、物体大幅度旋转之后辨识能力低下等缺点,针对这些问题采用相应的优化算法是提高模型准确率的关键。研究发现模型准确率会随着神经网络层数的增加而提高,但模型结构的复杂性会加大计算量,延长训练模型时间,并且训练数据集大小也会在一定程度上影响模型的准确率,因此深度学习的方法还需要不断地优化。

技术实现思路

[0006]本专利技术是为了解决上述问题而进行的,目的在于提供一种基于PAD的影像情感标注的方法。
[0007]本专利技术提供了一种基于PAD的影像情感标注的方法,具有这样的特征,包括以下步骤:步骤1,收集情感词语构建情感词语集合,评定并计算情感词语集合中的每个情感词语在PAD空间的空间坐标值;
[0008]步骤2,设计图像来表达对应的情感词语,并根据图像构建图像库,为每个图像选择最贴切的第一情感词语并进行初次验证;
[0009]步骤3,评定并计算影像库中的每个图像在PAD空间的坐标值的平均值,得到每个图像基于PAD空间的空间坐标值;
[0010]步骤4,对图像与情感词语集合中的情感词语在PAD空间中的欧式距离进行计算,
根据欧式距离对图像选择的第一情感词语进行二次验证;
[0011]步骤5,二次验证通过后,将第一情感词语作为情感标签为对应的图像进行标注。
[0012]在本专利技术提供的基于PAD的影像情感标注的方法中,还可以具有这样的特征:其中,步骤1中,PAD空间由愉悦度、激活度和优势度三个维度构成,通过人工评定对每个情感词语的愉悦度、激活度和优势度进行评分并分别计算各评分的平均值,作为每个情感词语在PAD空间的空间坐标值。
[0013]在本专利技术提供的基于PAD的影像情感标注的方法中,还可以具有这样的特征:其中,步骤2中,进行初次验证时,验证为每个图像选择最贴切的第一情感词语是否正确,当验证通过时,进入步骤3,当验证未通过时,重新对图像进行设计来表达对应的情感词语。
[0014]在本专利技术提供的基于PAD的影像情感标注的方法中,还可以具有这样的特征:其中,步骤3中,PAD空间由愉悦度、激活度和优势度三个维度构成,通过人工评定对每个图像的愉悦度、激活度和优势度进行评分并分别计算各评分的平均值,作为每个图像在PAD空间的空间坐标值。
[0015]在本专利技术提供的基于PAD的影像情感标注的方法中,还可以具有这样的特征:其中,步骤4中,根据欧式距离对图像选择的第一情感词语进行二次验证时,验证图像与第一情感词语的欧氏距离是否为最小值,当验证通过时,进入步骤5,当验证未通过时,重新对图像进行设计。
[0016]专利技术的作用与效果
[0017]根据本专利技术所涉及的一种基于PAD的影像情感标注的方法,基于PAD情感空间能够很好地对图像或视频等进行维度量化分析,并且通过二次验证能够精确的将图像与情感词语进行对应。相较于现有的技术方案,标注成本低,步骤简练,不需要依靠大量的数据集来训练算法或模型,且标注准确率高,符合人类的通常情感认知。
附图说明
[0018]图1是本专利技术的实施例的一种基于PAD的影像情感标注的方法的流程示意图;
[0019]图2是本专利技术的实施例中PAD空间的示意图。
具体实施方式
[0020]为了使本专利技术实现的技术手段与功效易于明白了解,以下结合实施例及附图对本专利技术作具体阐述。
[0021]<实施例>
[0022]图1是本专利技术的实施例的一种基于PAD的影像情感标注的方法的流程示意图。
[0023]如图1所示,本实施例的一种基于PAD的影像情感标注的方法,包括以下步骤:
[0024]步骤1,收集n项情感词语构建情感词语集合,n项情感词语分别记为e1,e2,......,e
n
,评定并计算情感词语集合中的每个情感词语在PAD空间的空间坐标值。
[0025]本实施例中,情感词语集合的情感词语可以从文献资料中收集,也可以从用户反馈的词语语料库中得到。
[0026]图2是本专利技术的实施例中PAD空间的示意图。
[0027]如图2所示,PAD情感空间维度是由愉悦度、激活度和优势度三个彼此独立的维度
构成,其中P代表愉悦度,表示个体情感状态的正负特性;A代表激活度,表示个体的神经生理激活水平;D代表优势度,表示个体对情景和他人的控制状态,可以通过三个维度的值表示具体的情感。+P和

P表示正性和负性,+A和

A表示高激活和低激活,+D和

D用于主动和被动。PAD三维空间模型可以有效测量和解释人的情感状态。划定每个维度的数值为(

1,1),以愉悦度举例,最正形的情感愉悦度数值为1,最负性的情感愉悦度为

1。
[0028]步骤1中,PAD空间由愉悦度、激活度和优势度三个维度构成,通过人工评定对每个情感词语的愉悦度、激活度和优势度进行评分并分别计算各评分的平均值,作为每个情感词语在PAD空间的空间坐标值,最终得到e1,e2,......,e
n
在PAD空间的空间坐标值为e1(p1,a1,d1),e2(p2,a2,d2),......e
n
(p
n
,a
n
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于PAD的影像情感标注的方法,其特征在于,包括以下步骤:步骤1,收集情感词语构建情感词语集合,评定并计算所述情感词语集合中的每个所述情感词语在PAD空间的空间坐标值;步骤2,设计图像来表达对应的所述情感词语,并根据所述图像构建图像库,为每个所述图像选择最贴切的第一情感词语并进行初次验证;步骤3,评定并计算所述影像库中的每个图像在所述PAD空间的坐标值的平均值,得到每个所述图像基于所述PAD空间的空间坐标值;步骤4,对所述图像与所述情感词语集合中的所述情感词语在所述PAD空间中的欧式距离进行计算,根据所述欧式距离对所述图像选择的所述第一情感词语进行二次验证;步骤5,所述二次验证通过后,将所述第一情感词语作为情感标签为对应的所述图像进行标注。2.根据权利要求1所述的基于PAD的影像情感标注的方法,其特征在于:其中,步骤1中,所述PAD空间由愉悦度、激活度和优势度三个维度构成,通过人工评定对每个所述情感词语的愉悦度、激活度和优势度进行评分并分别计算...

【专利技术属性】
技术研发人员:由芳刘雨佳王城极王羽希王建民
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1