【技术实现步骤摘要】
一种融合文本信息的GIF短视频情感识别方法及系统
本专利技术涉及一种视频情感识别方法及系统,尤其涉及一种融合文本信息的GIF短视频情感识别方法及系统,属于计算机视觉视频情感识别
技术介绍
视频序列中的情感识别是一项涉及计算机视觉、模式识别及人工智能等多领域的研究课题。随着互联网技术的快速发展,社交媒体的日渐成熟,越来越多的人使用短视频来表达他们的观点和情感。然而短视频的情感识别由于语义鸿沟问题的存在以及视频序列的情感信息学习的困难,所以要提出一种既能学习视频序列信息又能准确理解情感语义的方法是一个很有挑战性的工作。传统的情感识别工作主要注重于可以直观表达情感的文本内容,根据文本情感研究的分析尺度的不同,可以将基于文本的情感识别分成三个等级:文档级,语句级和实体级。而近年来随着社交多媒体内容的丰富,视觉情感分析逐步成为研究的热点,根据视觉研究的内容形式的不同,可以将视觉情感分析分为两类:图像情感分析和视频情感分析。针对图像的情感分析中,文献[S.Siersdorfer,E.Minack,F.Deng,andJ.S.Hare,"Analyzingandpredictingsentimentofimagesonthesocialweb."InACMMM,pages715–718,2010.]提出从像素级特征的层面对图像的情感进行分析,然而由于情感的复杂性,底层特征并不能很好的表现图像的情感含义。随着深度学习算法的逐步发展,越来越多的文献通过深度神经网络开始理解图像语义层面的特征。文献[H.J.QuanzengYou,JieboLuoandJ.Yan," ...
【技术保护点】
1.一种融合文本信息的GIF短视频情感识别方法,其特征在于,包括如下步骤:(1)将带有注释文本的GIF短视频按照设定帧率分割为若干候选帧图像;(2)利用3D卷积神经网络C3D提取由设定长度的候选帧图像组成的视频片段的序列特征,同时利用卷积神经网络CNN按顺序提取相应视频片段中帧图像的图像特征,将序列特征与图像特征串联融合;(3)将步骤(2)融合后的视频片段特征输入到卷积长短时记忆神经网络中进行解码,并使用softmax分类器获得GIF短视频所属情感类别的概率矩阵,将其从分类概率区间映射到情感分值区间后,作为视频部分的情感得分;(4)将与GIF短视频内容相关联的注释文本进行分词处理、词形还原,根据构建的同义词森林筛选出情感词组标签,并输入到情感打分工具中获得注释文本的情感得分;(5)将步骤(3)与步骤(4)的视频情感得分与文本情感得分赋予不同的情感权重后相加,采用自适应阈值法对分值进行有效性判断后作为描述GIF短视频的情感丰富程度的得分,并根据分值的正负性对GIF短视频进行情感分类;所述情感权重和阈值根据样本数据的预测情感类别与真实情感类别的损失函数,采用梯度下降法自学习得到。
【技术特征摘要】
1.一种融合文本信息的GIF短视频情感识别方法,其特征在于,包括如下步骤:(1)将带有注释文本的GIF短视频按照设定帧率分割为若干候选帧图像;(2)利用3D卷积神经网络C3D提取由设定长度的候选帧图像组成的视频片段的序列特征,同时利用卷积神经网络CNN按顺序提取相应视频片段中帧图像的图像特征,将序列特征与图像特征串联融合;(3)将步骤(2)融合后的视频片段特征输入到卷积长短时记忆神经网络中进行解码,并使用softmax分类器获得GIF短视频所属情感类别的概率矩阵,将其从分类概率区间映射到情感分值区间后,作为视频部分的情感得分;(4)将与GIF短视频内容相关联的注释文本进行分词处理、词形还原,根据构建的同义词森林筛选出情感词组标签,并输入到情感打分工具中获得注释文本的情感得分;(5)将步骤(3)与步骤(4)的视频情感得分与文本情感得分赋予不同的情感权重后相加,采用自适应阈值法对分值进行有效性判断后作为描述GIF短视频的情感丰富程度的得分,并根据分值的正负性对GIF短视频进行情感分类;所述情感权重和阈值根据样本数据的预测情感类别与真实情感类别的损失函数,采用梯度下降法自学习得到。2.根据权利要求1所述的融合文本信息的GIF短视频情感识别方法,其特征在于,所述步骤(2)中包括:(2.1)将步骤(1)提取出的视频候选帧图像每连续L帧视为一个序列,使用3D卷积神经网络提取出每个序列的池化五层特征;其中L为设定的序列长度,不足L帧时对最后一帧进行过采样,填补为一个序列;(2.2)将每个序列中的图像按顺序输入卷积神经网络CNN提取出每帧图像的池化五层特征;(2.3)将步骤(2.1)中的池化五层序列特征与步骤(2.2)中的池化五层图像特征串联融合作为表示视频片段的底层输入特征。3.根据权利要求1所述的融合文本信息的GIF短视频情感识别方法,其特征在于,所述步骤(3)将分类概率区间映射到情感分值区间的方法为:对softmax输出的概率矩阵P=[p0p1p-1],取Pmax=max[p0,p1,p-1],其中p0为判断为中性情感的概率,p1为判断为积极情感的概率,p-1为判断为消极情感的概率,按照如下公式将Pmax从概率区间映射到分值区间[-1,1]得到视频情感得分Sv:4.根据权利要求1所述的融合文本信息的GIF短视频情感识别方法,其特征在于,所述步骤(4)中根据情感词组中每个单词Wi在情感打分工具SentiWordNet中的情感分值,获得文本的情感得分St:其中,n为情感词组中单词的个数。5.根据...
【专利技术属性】
技术研发人员:刘天亮,万俊伟,刘峰,戴修斌,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。