一种视频精彩片段识别方法及装置制造方法及图纸

技术编号：22167019 阅读：79 留言：0更新日期：2019-09-21 10:37

本发明专利技术提供了一种视频精彩片段识别方法及装置，从视频片段中提取了视觉维度的特征，即图像特征向量，同时，还提取了听觉维度的特征，即音频特征向量。音频信息也是视频的一个重要构成，音频的节奏变化在一定程度上能够反映视频片段的精彩程度。因此，综合考虑视频特征和音频特征来判断该视频片段是否是精彩片段，能够提高精彩片段识别的准确度。而且，该方法提取视觉维度的特征，同时还捕捉了视频中时间维度和空间维度的特征，因此，在一定程度上也能够提高识别精彩片段的准确度。

A Method and Device for Video Splendid Fragment Recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种视频精彩片段识别方法及装置
本专利技术属于计算机
，尤其涉及一种视频精彩片段识别方法及装置。
技术介绍
随着网络技术和智能移动设备迅速发展，大量的视频信息涌现在用户面前。这些视频信息丰富了我们的生活，但是，视频信息的丰富性是以无结构性为代价。当需要从大量视频中找到精彩的视频片段时，精彩视频片段识别技术凸显出重要性。精彩片段识别技术能够自动识别出视频中的精彩片段，并提取出来。但目前的精彩片段识别技术基于图片特征来识别视频片段是否是精彩片段，识别结果精度低。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种视频精彩片段识别方法及装置，以解决传统的精彩片段识别方法的识别结果精度低的技术问题。其具体的技术方案如下：第一方面，本专利技术提供了一种视频精彩片段识别方法，包括：提取待识别视频片段中同一时间片段对应的音频特征向量及图像特征向量，所述音频特征向量表征所述待识别视频片段在时间维度上的音频信息，所述图像特征向量表征所述待识别视频片段在时间维度及空间维度包含的信息；根据所述视频特征向量和音频特征向量生成音视频特征向量；利用预先训练得到的分类器分析所述音视频特征向量，得到所述待识别视频片段的精彩度分类结果。在第一方面的一种可能的实现方式中，所述分类器的训练过程，包括：获取多个视频片段样本数据，每个所述视频片段样本数据包含表征所述视频片段样本数据的精彩度标注信息；针对每一视频片段样本数据，提取所述视频片段样本数据中同一时间片段对应的图像特征向量和音频特征向量；根据同一视频片段样本数据对应的图像特征向量和音频特征向量生成音视频特征向量；利用预设分类器模型分析各...

【技术保护点】
1.一种视频精彩片段识别方法，其特征在于，包括：提取待识别视频片段中同一时间片段对应的音频特征向量及图像特征向量，所述音频特征向量表征所述待识别视频片段在时间维度上的音频信息，所述图像特征向量表征所述待识别视频片段在时间维度及空间维度包含的信息；根据所述视频特征向量和音频特征向量生成音视频特征向量；利用预先训练得到的分类器分析所述音视频特征向量，得到所述待识别视频片段的精彩度分类结果。

【技术特征摘要】
1.一种视频精彩片段识别方法，其特征在于，包括：提取待识别视频片段中同一时间片段对应的音频特征向量及图像特征向量，所述音频特征向量表征所述待识别视频片段在时间维度上的音频信息，所述图像特征向量表征所述待识别视频片段在时间维度及空间维度包含的信息；根据所述视频特征向量和音频特征向量生成音视频特征向量；利用预先训练得到的分类器分析所述音视频特征向量，得到所述待识别视频片段的精彩度分类结果。2.根据权利要求1所述的方法，其特征在于，所述分类器的训练过程，包括：获取多个视频片段样本数据，每个所述视频片段样本数据包含表征所述视频片段样本数据的精彩度标注信息；针对每一视频片段样本数据，提取所述视频片段样本数据中同一时间片段对应的图像特征向量和音频特征向量；根据同一视频片段样本数据对应的图像特征向量和音频特征向量生成音视频特征向量；利用预设分类器模型分析各个视频片段样本数据对应的音视频特征向量，得到每个视频片段样本数据的精彩度分类结果；依据所述各个视频片段样本数据对应的精彩度分类结果及精彩度标注信息，调整所述预设分类器模型中的模型参数，直到利用调整后的分类器模型对所述各个视频片段样本数据进行分类得到的分类结果满足预设收敛条件。3.根据权利要求1所述的方法，其特征在于，所述利用预先训练得到的分类器分析所述音视频特征向量，得到所述待识别视频片段的精彩度分类结果，包括：利用预先训练得到的分类器分析所述待识别视频片段的音视频特征向量，得到所述待识别视频片段属于两个类别中每个类别的置信度；选取置信度最大的分类结果，确定为所述待识别视频片段目标分类结果。4.根据权利要求1所述的方法，其特征在于，所述利用预先训练得到的分类器分析所述音视频特征向量，得到所述待识别视频片段的精彩度分类结果，包括：利用预先训练得到的分类器分析所述待识别视频片段的音视频特征向量，得到所述待识别视频片段的精彩度分数；当所述精彩度分数大于或等于预设分数值时，确定所述待识别视频片段是精彩片段；当所述精彩度分数小于所述预设分数值时，确定所述待识别视频片段不是精彩片段。5.根据权利要求1-4任一项所述的方法，其特征在于，在提取待识别视频片段中同一时间片段对应的音频特征向量及图像特征向量之前，所述方法还包括：获取待识别视频；识别所述待识别视频所包含的关键帧，并依据所述关键帧划分所述待识别视频得到多个视频片段；从所述多个视频片段中获取任意一个视频片段确定为所述待识...

【专利技术属性】
技术研发人员：张云桃，晋瑞锦，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人