视频指纹生成方法、装置、设备及存储介质制造方法及图纸

技术编号：37471212 阅读：26 留言：0更新日期：2023-05-06 09:52

本公开提供一种视频指纹生成方法、装置、设备及存储介质，涉及人工智能技术领域，具体涉及计算机视觉、视频图像识别、数据标记等技术领域，可应用于同源视频识别、视频推荐等场景下。具体实现方案包括：对视频数据库中的每个视频，将视频作为第一视频，从第二视频的抽帧图像中，确定第一视频的每一帧抽帧图像对应的目标抽帧图像，第二视频为除第一视频之外的其他视频；根据目标抽帧图像所在的目标第二视频，确定第一视频的同源视频；为存在同源关系的同一组同源视频生成相同的视频指纹。本公开可以准确识别视频数据库中的同源视频，并为同源视频赋予相同的视频指纹，每组同源视频的视频指纹能够唯一标识该组同源视频的身份信息。频指纹能够唯一标识该组同源视频的身份信息。频指纹能够唯一标识该组同源视频的身份信息。

全部详细技术资料下载

【技术实现步骤摘要】
视频指纹生成方法、装置、设备及存储介质

[0001]本公开涉及人工智能
，具体涉及计算机视觉、视频图像识别、数据标记等
，可应用于同源视频识别、视频推荐等场景下，尤其涉及一种视频指纹生成方法、装置、设备及存储介质。

技术介绍

[0002]视频作为一种信息流，可以为用户带来丰富的观看体验，也可以用于广告推荐。视频平台的视频数据库中经常存在大量的同源视频。其中，同源视频一般是指存在部分帧或全部帧的画面(图像)完成相同、或者仅做了微小改动的视频。例如，作者1发布了原创的视频X，作者2将视频X搬运到了自己的账号下发布了视频Y，则视频X和视频Y为同源视频。又例如，某个广告分别在流量场景1中以广告视频1的形式进行展示，在流量场景2中以广告视频2的形式进行展示，但广告视频1和广告视频2的内容相同，则广告视频1和广告视频2也为同源视频。
[0003]对于视频平台而言，视频数据库中的同源视频不仅存在侵犯原创作者的著作权的风险，而且，当同源视频被推送给用户侧时，重复推送同源视频可能导致用户体验不佳。

技术实现思路
r/>[0004]本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频指纹生成方法，所述方法包括：按照预设时间间隔对视频数据库中的每个视频进行抽帧，得到每个所述视频的至少两帧抽帧图像；对所述视频数据库中的每个视频，将所述视频作为第一视频，根据所述第一视频的抽帧图像，从第二视频的抽帧图像中，确定所述第一视频的每一帧抽帧图像对应的目标抽帧图像，所述目标抽帧图像与所述目标抽帧图像对应的抽帧图像之间的相似度满足预设相似度要求，所述第二视频为所述视频数据库中除所述第一视频之外的其他视频；根据所述目标抽帧图像所在的目标第二视频，确定所述第一视频的同源视频，得到所述视频数据库中的视频之间的同源关系；根据所述视频数据库中的视频之间的同源关系，为存在同源关系的同一组同源视频生成相同的视频指纹，所述视频指纹用于唯一标识所述同源关系。2.根据权利要求1所述的方法，所述根据所述目标抽帧图像所在的目标第二视频，确定所述第一视频的同源视频，得到所述视频数据库中的视频之间的同源关系，包括：获取所述第一视频的每一帧抽帧图像相对于每个所述目标第二视频所对应的第一距离；其中，对所述第一视频的每一帧抽帧图像，当所述目标第二视频中存在所述抽帧图像对应的目标抽帧图像时，所述第一距离为所述抽帧图像与所述抽帧图像对应的目标抽帧图像之间的距离；当所述目标第二视频中不存在所述抽帧图像对应的目标抽帧图像时，所述第一距离为默认距离；根据所述第一视频的每一帧抽帧图像相对于每个所述目标第二视频所对应的第一距离，确定所述第一视频与每个所述目标第二视频之间的第二距离，所述第二距离为所述第一距离的平均距离或累积最小距离；根据所述第一视频与每个所述目标第二视频之间的第二距离，从所述目标第二视频中选择满足第二距离预设距离要求的目标第二视频作为所述第一视频的同源视频。3.根据权利要求1或2所述的方法，所述根据所述第一视频的抽帧图像，从第二视频的抽帧图像中，确定所述第一视频的每一帧抽帧图像对应的目标抽帧图像之前，所述方法还包括：采用预设的视觉特征提取模型，对所述视频数据库中的每个视频的抽帧图像进行特征提取，得到每一帧所述抽帧图像的特征向量；其中，所述视觉特征提取模型用于：将输入的抽帧图像切分为至少两个区域，并根据每个区域的像素特征和位置信息，输出所述抽帧图像的特征向量；所述根据所述第一视频的抽帧图像，从第二视频的抽帧图像中，确定所述第一视频的每一帧抽帧图像对应的目标抽帧图像，包括：根据所述第一视频的抽帧图像的特征向量与所述第二视频的抽帧图像的特征向量之间的相似度，从所述第二视频的抽帧图像中，确定所述第一视频的每一帧抽帧图像对应的目标抽帧图像。4.根据权利要求3所述的方法，所述根据所述第一视频的抽帧图像的特征向量与所述第二视频的抽帧图像的特征向量之间的相似度，从所述第二视频的抽帧图像中，确定所述第一视频的每一帧抽帧图像对应的目标抽帧图像之前，所述方法还包括：
采用HNSW方法，对所述视频数据库中的所有视频的抽帧图像的特征向量构建索引库；所述根据所述第一视频的抽帧图像的特征向量与所述第二视频的抽帧图像的特征向量之间的相似度，从所述第二视频的抽帧图像中，确定所述第一视频的每一帧抽帧图像对应的目标抽帧图像，包括：根据所述索引库，确定所述第一视频的抽帧图像的特征向量与所述第二视频的抽帧图像的特征向量之间的相似度，并从所述第二视频的抽帧图像中，确定所述第一视频的每一帧抽帧图像对应的目标抽帧图像。5.根据权利要求1
‑
4任一项所述的方法，所述预设相似度要求包括：在所述第一视频的抽帧图像与所述第二视频的抽帧图像之间的相似度的排序中位于相似度最高的前K位、且相似度大于预设相似度阈值，K为大于0的整数。6.根据权利要求1
‑
5任一项所述的方法，所述根据所述视频数据库中的视频之间的同源关系，为存在同源关系的同一组同源视频生成相同的视频指纹，包括：根据所述视频数据库中的视频之间的同源关系，生成所述视频数据库对应的同源关系网络，所述同源关系网络包括至少一个子网络，每个所述子网络中包括至少一个视频、且每个所述子网络中的所有视频之间为同源视频，不同的子网络彼此隔离；根据所述同源关系网络，为每个所述子网络中的视频生成相同的视频指纹。7.根据权利要求1
‑
6任一项所述的方法，所述根据所述同源关系网络，为每个所述子网络中的视频生成相同的视频指纹，包括：按照预设的指纹编码规则，为不同的所述子网络生成唯一身份标识信息；根据所述子网络的身份标识信息，为所述子网络中的视频生成相同的视频指纹。8.根据权利要求1
‑
6任一项所述的方法，所述根据所述同源关系网络，为每个所述子网络中的视频生成相同的视频指纹，包括：对每个所述子网络，根据所述子网络中的一个或多个视频的属性信息进行哈希运算，得到所述子网络对应的哈希值；根据所述子网络对应的哈希值，为所述子网络中的视频生成相同的视频指纹。9.根据权利要求1
‑
8任一项所述的方法，所述预设时间间隔的大小与被抽帧的视频的长度正相关。10.一种视频指纹生成装置，所述装置包括：视频处理单元，用于按照预设时间间隔对视频数据库中的每个视频进行抽帧，得到每个所述视频的至少两帧抽帧图像；同源...

【专利技术属性】
技术研发人员：金志鹏，温周伏土，闻铭，杨羿，贾魏，陈晓冬，
申请(专利权)人：百度中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人