一种视频片段标签识别方法及装置制造方法及图纸

技术编号：22167016 阅读：30 留言：0更新日期：2019-09-21 10:37

本申请提供一种视频片段标签识别方法，包括：获取目标视频片段；提取目标视频片段的图像特征和音频特征；利用预先完成训练的多标签分类模型分析目标视频片段的图像特征和音频特征，得到目标视频片段的标签分类结果，目标视频片段的标签分类结果包括目标视频片段在至少两个维度的类别标签。基于本申请提供的方案，能够全面的识别目标视频片段的标签，而且，能够提高标签识别结果的准确度。

A Method and Device for Video Fragment Label Recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种视频片段标签识别方法及装置
本申请属于视频识别
，尤其涉及一种视频片段标签识别方法及装置。
技术介绍
随着网络技术和多媒体技术的迅速发展，大量的视频信息涌现在用户面前。这些视频信息丰富了用户的生活，但是，视频信息的丰富性是以无结构性为代价。当需要从大量视频中找到期望的视频片段时，视频片段的标签识别技术就越发重要。而且，视频片段的标签对于提升视频片段的推荐分发效果，自动精准广告投放，建立视频片段的内容检索能力，生成特定内容的视频集锦等方面，都具有重要作用。但是，申请人发现：目前的视频片段标签识别技术普遍存在识别结果的准确度较低的问题，而且识别出的标签也较为单一。
技术实现思路
在鉴于此，本申请实施例提供一种视频片段标签识别方法及装置，以实现对视频片段进行更加准确、全面的标签识别的目的。为实现上述目的，本申请实施例提供如下技术方案：本申请提供一种视频片段标签识别方法，所述方法包括：获取目标视频片段；提取所述目标视频片段的图像特征和音频特征；利用预先完成训练的多标签分类模型分析所述目标视频片段的图像特征和音频特征，得到所述目标视频片段的标签分类结果，所述目标视频片段的标签分类结果包括所述目标视频片段在至少两个维度的类别标签；其中，用于训练所述多标签分类模型的每个第一视频片段样本包含在至少两个维度标注的类别标签。可选的，在上述方法中，所述多标签分类模型的训练过程，包括：获取多个第一视频片段样本；分别提取每个所述第一视频片段样本的图像特征和音频特征；利用预先构建的多标签分类模型分析所述多个第一视频片段样本的图像图中和音频特征，得到每个第一视频片段样本的标签分类...

【技术保护点】
1.一种视频片段标签识别方法，其特征在于，所述方法包括：获取目标视频片段；提取所述目标视频片段的图像特征和音频特征；利用预先完成训练的多标签分类模型分析所述目标视频片段的图像特征和音频特征，得到所述目标视频片段的标签分类结果，所述目标视频片段的标签分类结果包括所述目标视频片段在至少两个维度的类别标签；其中，用于训练所述多标签分类模型的每个第一视频片段样本包含在至少两个维度标注的类别标签。

【技术特征摘要】
1.一种视频片段标签识别方法，其特征在于，所述方法包括：获取目标视频片段；提取所述目标视频片段的图像特征和音频特征；利用预先完成训练的多标签分类模型分析所述目标视频片段的图像特征和音频特征，得到所述目标视频片段的标签分类结果，所述目标视频片段的标签分类结果包括所述目标视频片段在至少两个维度的类别标签；其中，用于训练所述多标签分类模型的每个第一视频片段样本包含在至少两个维度标注的类别标签。2.根据权利要求1所述的方法，其特征在于，所述多标签分类模型的训练过程，包括：获取多个第一视频片段样本；分别提取每个所述第一视频片段样本的图像特征和音频特征；利用预先构建的多标签分类模型分析所述多个第一视频片段样本的图像图中和音频特征，得到每个第一视频片段样本的标签分类结果；依据所述多个第一视频片段样本的标签分类结果和标注的类别标签，调整所述多标签分类模型的模型参数，直至调整后的多标签分类模型满足预设收敛条件。3.根据权利要求1或2所述的方法，其特征在于，所述获取目标视频片段，包括：获得目标视频；将所述目标视频拆分成多个视频片段；分别确定所述多个视频片段是否为精彩视频片段；在精彩视频片段中获取任意一个精彩视频片段确定为所述目标视频片段。4.根据权利要求3所述的方法，其特征在于，确定任意一个视频片段是否为精彩视频片段，包括：提取所述视频片段的图像特征和音频特征；利用预先完成训练的精彩度分类模型分析所述视频片段的图像特征和音频特征，得到所述视频片段的精彩度分类结果，所述精彩度分类结果用于指示所述视频片段是否为精彩视频片段。5.根据权利要求4所述的方法，其特征在于，所述精彩度分析模型的训练过程，包括：获取多个第二视频片段样本，每个所述第二视频片段样本包含标注的精彩度信息；分别提取每个所述第二视频片段样本的图像特征和音频特征；利用预先构建的精彩度分类模型分析所述多个第二视频片段样本的图像图中和音频特征，得到每个第二视频片段样本的精彩度分类结果；依据所述多个第二视频片段样本的精彩度分类结果和标注的精彩度信息，调整所述精彩度分类模型的模型参数，直至调整后的精彩度分类模型满足预设收敛条件。6.根据权利要求4所述的方法，其特征在于，利用预先完成训练的精彩度分类模型分析所述视频片段的图像特征和音频特征，得到所述视频片段的精彩度分类结果，包括：利用预先完成训练的精彩度分类模型分析所述视频片段的图像特征和音频特征，得到所述视频片段属于两个类别中每个类别的置信度；选取置信度最大的分类结果，确定为所述视频片段的精彩度分类结果。7.根据权利要求4所述的方法，其特征在于，利用预先完成训练的精彩度分类模型分析所述视频片段的图像特征和音频特征，得到所述视频片...

【专利技术属性】
技术研发人员：晋瑞锦，张云桃，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人