确定目标视频的标签的方法、装置、计算设备及存储介质制造方法及图纸

技术编号：26924085 阅读：11 留言：0更新日期：2021-01-01 22:48

本申请公开了一种确定目标视频的标签的方法、装置、计算设备以及计算机可读存储介质。该方法包括：确定所述目标视频的特征向量；基于所述目标视频的特征向量与至少一个已有视频的特征向量，从所述至少一个已有视频中确定所述目标视频的相似视频，其中所述相似视频与所述目标视频的相似度大于预设相似度阈值，并且每个所述至少一个已有视频具有至少一个标签；基于所述相似视频的标签，确定所述目标视频的标签。本申请的方法可提高为目标视频确定的标签的准确度，提高了确定标签的过程的效率，并且减少了成本。

全部详细技术资料下载

【技术实现步骤摘要】
确定目标视频的标签的方法、装置、计算设备及存储介质
本申请涉及数据处理的
，尤其涉及一种确定目标视频的标签的方法、装置、计算设备以及计算机可读存储介质。
技术介绍
在互联网和移动通信技术快速发展的时代，尤其是近些年来短视频的迅速发展，网络中视频量以指数级的速度增长，因此使用户能够准确快速地搜索到期望的视频或者向用户准确地推荐合适（例如，符合其兴趣）的视频逐渐成了关注点。这通常依赖于视频的标签。目前，为视频确定标签的方法主要是人工观看视频并确认。这个过程需要大量的人力，时间和金钱成本都非常高。而且，对于一些特定领域的视频，往往需要该领域内的专业人士才能确定匹配度高的标签。另外，并不排除一些视频制作者为了获取更高的关注度而恶意添加与视频内容不符的标签。除了人工添加标签的方法，还可以通过机器学习等方式从视频的标题或视频涉及的文本内容中识别一些标签来供人工标记参考。但是，视频相关的文本内容通常只有一个标题，字数一般小于20，难以概括整个视频的所有关键信息。对于不以文字为主要元素或文字元素难以提取的视频来说，从中识别标签的准确度是比较低的，或者可能需要人工再次确认和选择标签，这无疑降低了识别标签的效率并且增加了识别标签的成本。
技术实现思路
根据本申请的第一方面，提供了一种确定目标视频的标签的方法。所述方法包括：确定所述目标视频的特征向量；基于所述目标视频的特征向量与至少一个已有视频的特征向量，从所述至少一个已有视频中确定所述目标视频的相似视频，其中所述相似视频与所述目标视频的相似度大于预设相似度阈值...

【技术保护点】
1.一种确定目标视频的标签的方法，其特征在于，所述方法包括：/n确定所述目标视频的特征向量；/n基于所述目标视频的特征向量与至少一个已有视频的特征向量，从所述至少一个已有视频中确定所述目标视频的相似视频，其中所述相似视频与所述目标视频的相似度大于预设相似度阈值，并且每个所述至少一个已有视频具有至少一个标签；/n基于所述相似视频的标签，确定所述目标视频的标签。/n

【技术特征摘要】
1.一种确定目标视频的标签的方法，其特征在于，所述方法包括：
确定所述目标视频的特征向量；
基于所述目标视频的特征向量与至少一个已有视频的特征向量，从所述至少一个已有视频中确定所述目标视频的相似视频，其中所述相似视频与所述目标视频的相似度大于预设相似度阈值，并且每个所述至少一个已有视频具有至少一个标签；
基于所述相似视频的标签，确定所述目标视频的标签。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
确定所述至少一个已有视频的特征向量，其中确定所述目标视频的特征向量的方式与确定所述至少一个已有视频的特征向量的方式相同。

3.根据权利要求1所述的方法，其特征在于，确定所述目标视频的特征向量包括：
确定所述目标视频的至少一种模态数据的全局特征向量；
基于所述至少一种模态数据的全局特征向量确定所述目标视频的特征向量。

4.根据权利要求3所述的方法，其特征在于，所述至少一种模态数据包括所述目标视频的图像数据、音频数据和文本数据中的至少一种，并且确定所述目标视频的至少一种模态数据的全局特征向量包括：
确定所述图像数据的全局特征向量、确定所述音频数据的全局特征向量和确定所述文本数据的全局特征向量中的至少一个；
其中，基于所述至少一种模态数据的全局特征向量确定所述目标视频的特征向量包括：
基于所述图像数据的全局特征向量、所述音频数据的全局特征向量和所述文本数据的全局特征向量中的至少一种确定所述目标视频的特征向量。

5.根据权利要求4所述的方法，其特征在于，所述图像数据包括所述目标视频的图像流，并且确定所述图像数据的全局特征向量包括：
从所述图像流的各图像帧中识别出场景特征并基于所述场景特征得到所述图像流的场景全局特征向量；
从所述图像流的各图像帧中识别出对象特征并基于所述对象特征得到所述图像流的对象全局特征向量；
从所述图像流的各图像帧中识别出人脸特征并基于所述人脸特征得到所述图像流的人脸全局特征向量；
基于所述场景全局特征向量、所述对象全局特征向量和所述人脸全局特征向量，得到所述图像数据的全局特征向量。

6.根据权利要求5所述的方法，其特征在于，从所述图像流的各图像帧中识别出场景特征并基于所述场景特征得到所述图像流的场景全局特征向量包括：
基于所述场景特征将所述图像流分割为多个镜头片段；
基于每个所述多个镜头片段的各图像帧的场景特征，得到所述多个镜头片段各自的场景镜头特征向量；
基于每个所述镜头片段在所述图像流中的时长占比对所述场景镜头特征向量加权；
基于已加权的所述场景镜头特征向量得...

【专利技术属性】
技术研发人员：刘刚，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人