一种基于视频的情感识别方法及装置制造方法及图纸

技术编号：25186877 阅读：20 留言：0更新日期：2020-08-07 21:14

本发明专利技术实施例公开了一种基于视频的情感识别方法及装置。该方法包括：确定待识别视频的初始特征数据；将所述初始特征数据输入到预先训练完成的情感识别模型中，得到与所述待识别视频对应的情感识别结果；其中，所述情感识别模型包括物体关系识别模型、特征提取模型和情感分类模型，其中，所述物体关系识别模型用于识别所述待识别视频中的物体关系，所述特征提取模型用于提取所述初始特征数据的至少一种视频特征，所述情感分类模型用于基于所述物体关系和所述视频特征确定所述待识别视频的情感识别结果。本发明专利技术实施例通过在情感识别模型中加入物体关系识别模型，解决了视频情感识别效果不佳的问题，为视频情感识别提供了更全面的识别框架。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于视频的情感识别方法及装置
本专利技术实施例涉及情感识别
，尤其涉及一种基于视频的情感识别方法及装置。
技术介绍
随着移动设备和互联网的快速发展，视频内容理解成为了日益增长的需求。许多研究者针对视频动作识别、检测等任务进行了大量的研究。然而，视频内情感的表达是视频理解中重要的环节，直观来说，则是将视频根据内容分为不同的情感类别，如开心、吃惊或悲伤等。视频的情感识别在实际生产中有很多应用，例如，广告推荐系统可以通过匹配广告与视频中的情感来避免推荐不恰当的广告。早期针对情感识别的研究集中在文本情感识别和图像情感识别，研究者通过文本、颜色、纹理、形状等底层特征帮助情感识别。之后，研究者针对视频情感的研究大多集中在电影领域，类似的底层特征在电影视频的情感分析中也起到了很大的作用。近年来，神经网络在越来越多的计算机视觉领域取得了较好的效果，如图像分类、物体检测等。一些研究者也将神经网络运用到了情感识别中，实现了相比底层特征更好的识别效果。然而，由于手机、相机等视频捕捉设备的发展，视频分享网站上越来越多的出现了用户生成视频。相比电影视频，用户生成视频没有经过专业编辑，内容更多样，但视频质量往往较差。因此，仅通过神经网络学习的视觉信息对于高维的情感识别仍是不够的，分类识别效果往往不佳。
技术实现思路
本专利技术实施例提供了一种基于视频的情感识别方法及装置，为视频情感识别提供了更全面的识别框架，以提高视频情感识别的准确率。第一方面，本专利技术实施例提供了一种基于视频的情感识别方...

【技术保护点】
1.一种基于视频的情感识别方法，其特征在于，包括：/n确定待识别视频的初始特征数据；/n将所述初始特征数据输入到预先训练完成的情感识别模型中，得到与所述待识别视频对应的情感识别结果；/n其中，所述情感识别模型包括物体关系识别模型、特征提取模型和情感分类模型，其中，所述物体关系识别模型用于识别所述待识别视频中的物体关系，所述特征提取模型用于提取所述初始特征数据的至少一种视频特征，所述情感分类模型用于基于所述物体关系和所述视频特征确定所述待识别视频的情感识别结果。/n

【技术特征摘要】
1.一种基于视频的情感识别方法，其特征在于，包括：
确定待识别视频的初始特征数据；
将所述初始特征数据输入到预先训练完成的情感识别模型中，得到与所述待识别视频对应的情感识别结果；
其中，所述情感识别模型包括物体关系识别模型、特征提取模型和情感分类模型，其中，所述物体关系识别模型用于识别所述待识别视频中的物体关系，所述特征提取模型用于提取所述初始特征数据的至少一种视频特征，所述情感分类模型用于基于所述物体关系和所述视频特征确定所述待识别视频的情感识别结果。

2.根据权利要求1所述的方法，其特征在于，所述初始特征数据包括RGB图像数据、光流图像数据、音频数据和文本数据中的至少一项；
其中，所述将所述初始特征数据输入到预先训练完成的情感识别模型中，得到与所述待识别视频对应的情感识别结果，包括：
将所述RGB图像数据输入到所述物体关系识别模型中，得到输出的物体关系特征；
将所述初始特征数据输入到所述特征提取模型中，得到输出的与各初始特征数据对应的视频特征；
将所述物体关系特征和所述视频特征输入到所述情感分类模型中，得到输出的情感识别结果。

3.根据权利要求2所述的方法，其特征在于，所述物体关系识别模型用于：
提取所述RGB图像数据中的视觉特征、位置特征和语义特征；
将所述视觉特征、位置特征和语义特征进行融合得到融合特征，并基于所述融合特征得到所述RGB图像数据中的物体关系特征。

4.根据权利要求3所述的方法，其特征在于，所述物体关系识别模型还用于：
针对每种物体关系特征，构建与所述物体关系特征对应的注意力图，并根据能量函数计算得到与所述注意力图对应的激活程度；
基于各所述激活程度，得到超过预设阈值的激活程度对应的物体关系特征。

5.根据权利要求4所述的方法，其特征在于，所述根据能量函数计算得到与所述注意力图对应的激活程度，包括：
根据能量函数和滑动窗口，计算所述注意力图在至少一个窗口区域内的激活程度；
将所述各窗口区域内的满足预设激活条件的激活程度作为与所述注意力图对应的激活程度，其中，所述预设激活条件包括最大激活程度...

【专利技术属性】
技术研发人员：徐宝函，
申请(专利权)人：上海极链网络科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人