一种视频情感定位方法及系统技术方案

技术编号：22167013 阅读：37 留言：0更新日期：2019-09-21 10:37

本发明专利技术公开一种视频情感定位方法及系统，属于计算机技术领域，该视频情感定位方法通过提取待处理视频的候选片段，并利用第一神经网络模型提取候选片段每帧的特征表示，再通过第二神经网络模型进行情感分类、边界回归、情感排序及完整性分类，最后过滤不符合要求的候选片段并输出待处理视频的情感定位片段，能实现快速准确地定位视频中体现整个视频情感的片段，且定位的片段边界清楚、完整。

A Video Emotion Location Method and System

全部详细技术资料下载

【技术实现步骤摘要】
一种视频情感定位方法及系统
本专利技术涉及计算机
，特别涉及一种视频情感定位方法及系统。
技术介绍
随着互联网和移动设备的发展，针对视频内容的识别近年来越来越受到科研工作者的重视。视频分类、检测已经有了很多研究，然而视频情感分析由于视频内容复杂而存在很多困难。早期针对情感内容的研究主要集中在图像情感识别，除了整体的图像特征，纹理、位置、人脸等特征在图像情感识别任务中也起到了一定的效果。在视频领域，早期的工作主要针对电影进行了情感分析，底层的视觉与音频特征结合在一些电影标准数据集上取得了良好的效果。近年来，卷积神经网络受到了越来越多的关注，并在图像分类、检测等任务上取得了较好的效果。一些研究者将神经网络应用于情感分析中，利用神经网络结合迁移学习的方法，在情感识别任务中展示了相比底层视觉特征更好的效果。然而现实中，视频一般是非专业拍摄且缺乏质量控制，且情感的表达在视频中一般是较为稀疏的，即并不是视频的所有帧都有情感的体现，很多视频包含了背景、人物等中立的片段。现有的分类算法都只是在整体视频层面上对情感进行分类，并没有关注具体哪些片段有情感的表达。有研究者将针对整个视频的算法应用于每帧的情感分析，然而由于用户生成的情感视频数据量较小，分类器训练比较困难，仅仅针对每帧分类效果并不理想。
技术实现思路
为解决上述技术问题，本专利技术提供了一种视频情感定位方法及系统，通过该方法，能快速准确地定位视频中体现了整个视频情感的片段。本专利技术实施例提供的技术方案如下：第一方面，提供了一种视频情感定位方法，所述方法至少包括如下步骤：将待处理视频进行片段定位，提取出若干个候选...

【技术保护点】
1.一种视频情感定位方法，其特征在于，所述方法至少包括如下步骤：将待处理视频进行片段定位，提取出若干个候选片段；通过预先训练好的第一神经网络模型，提取所述候选片段每帧的特征表示；基于所述候选片段每帧的特征表示，通过预先训练好的第二神经网络模型，对所述候选片段进行情感分类、边界回归、情感排序及完整性分类；基于所述第二神经网络模型的输出结果，过滤不符合要求的候选片段；输出所述待处理视频的情感定位片段。

【技术特征摘要】
1.一种视频情感定位方法，其特征在于，所述方法至少包括如下步骤：将待处理视频进行片段定位，提取出若干个候选片段；通过预先训练好的第一神经网络模型，提取所述候选片段每帧的特征表示；基于所述候选片段每帧的特征表示，通过预先训练好的第二神经网络模型，对所述候选片段进行情感分类、边界回归、情感排序及完整性分类；基于所述第二神经网络模型的输出结果，过滤不符合要求的候选片段；输出所述待处理视频的情感定位片段。2.根据权利要求1所述的一种视频情感定位方法，其特征在于，所述第二神经网络模型为金字塔网络模型，基于所述候选片段每帧的特征表示，通过预先训练好的金字塔网络模型，对所述候选片段进行情感分类、边界回归、情感排序及完整性分类时，至少包括如下子步骤：将所述候选片段分成开始阶段、中间阶段及结束阶段；分别获取所述候选片段中开始阶段、中间阶段及结束阶段的特征表示，为第一特征表示、第二特征表示及第三特征表示；将所述第一特征表示、第二特征表示及第三特征表示连接形成所述候选片段的全局特征表示；通过所述全局特征表示，对所述候选片段进行情感分类、边界回归、情感排序及完整性分类。3.根据权利要求2所述的一种视频情感定位方法，其特征在于，所述通过所述候选片段的全局特征表示，对所述候选片段进行情感分类、边界回归、情感排序及完整性分类，具体包括如下子步骤：根据所述全局特征表示，将各维度情感数据进行对比，将情感数据最高的维度作为所述候选片段的情感类别；根据所述全局特征表示，调整所述候选片段的中间点及长度，进行候选片段的边界回归；根据所述全局特征表示，将任意两个所述候选片段进行一一对比，获取所述候选片段的情感排序；根据所述全局特征表示，验证所述候选片段是否完整，并根据验证结果将所述候选片段分为完整候选片段与不完整候选片段两类。4.根据权利要求1或2所述的一种视频情感定位方法，其特征在于，所述过滤不符合要求的候选片段，至少包括如下子步骤：过滤情感分类结果与待处理视频整体情感类型不相符的候选片段；过滤不完整的候选片段；过滤情感排序在设定排序阈值之外的候选片段。5.根据权利要求1所述的一种视频情感定位方法，其特征在于，所述预先训练好的第一神经网络模型为：TemporalSegmentNetwork(TSN)或I3D中的一种。6.一种视频情感定位系统，其特征在于...

【专利技术属性】
技术研发人员：徐宝函，郑莹斌，叶浩，王恒，孙谷飞，
申请(专利权)人：众安信息技术服务有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人