一种视频内容去重的处理方法技术

技术编号：10781617 阅读：190 留言：0更新日期：2014-12-17 02:37

本发明专利技术涉及一种视频内容去重的处理方法，所述的视频内容去重的处理方法包括如下步骤：（1）根据视频的时长进行排序形成链表；（2）在设置的窗口内，计算所述链表中的视频与待验视频的时长相似度；如所述时长相似度达到设定的阈值范围，执行步骤（3）；否则，将所述待验视频插入到所述链表中；（3）在所述的窗口内进一步计算其他元数据相似度，并结合所述时长相似度和所述其他元数据相似度，所述其他元数据包括：视频标题、标签、关键词、上传时间、文件大小，判定所述链表中是否已存在所述的待验视频；如所述链表中不存在所述的待验视频，将所述待验视频插入到所述链表中；否则，放弃该待验视频。该处理方法在降低计算复杂度的同时，能保障视频内容去重处理的有效性。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及，所述的视频内容去重的处理方法包括如下步骤：(1)根据视频的时长进行排序形成链表；（2)在设置的窗口内，计算所述链表中的视频与待验视频的时长相似度；如所述时长相似度达到设定的阈值范围，执行步骤（3);否则，将所述待验视频插入到所述链表中；（3)在所述的窗口内进一步计算其他元数据相似度，并结合所述时长相似度和所述其他元数据相似度，所述其他元数据包括：视频标题、标签、关键词、上传时间、文件大小，判定所述链表中是否已存在所述的待验视频；如所述链表中不存在所述的待验视频，将所述待验视频插入到所述链表中；否则，放弃该待验视频。该处理方法在降低计算复杂度的同时，能保障视频内容去重处理的有效性。【专利说明】
本专利技术涉及多媒体通信领域，特别涉及。
技术介绍
互联网视频业务中，在视频获取、搜索、推荐时，如何识别出高相似度视频成为限制硬件资源节省、用户体验的提高。现有的视频去重处理方法有下面几种： (1)根据视频文件MD5值去重。为了完整性校验和版权保护，每个视频文件中都保存有一个MD5值，具有相同的MD5值的视频可以认为是同一视频。这种方法的局限性在于，只能识别出具有完全相同来源的视频，视频经过转码后MD5值就会变化，而且无法识别出内容高度相似的视频。 (2)根据视频文本元数据信息去重，最常用的是基于向量空间模型（VSM)的方法，根据视频的描述信息提取出视频的文本特征，为视频建立一个文本向量空间模型：，term是提取出的视频文本特征tag, weight是这个tag的权重。在为每个视频建...

【技术保护点】
一种视频内容去重的处理方法，其特征在于，所述的视频内容去重的处理方法包括如下步骤：（1）根据视频的时长进行排序形成链表；（2）在设置的窗口内，计算所述链表中的视频与待验视频的时长相似度；如所述时长相似度达到设定的阈值范围，执行步骤（3）；否则，将所述待验视频插入到所述链表中；（3）在所述的窗口内进一步计算其他元数据相似度，所述其他元数据包括：视频标题、标签、关键词、上传时间、文件大小，并结合所述时长相似度和所述其他元数据相似度，判定所述链表中是否已存在所述的待验视频；如所述链表中不存在所述的待验视频，将所述待验视频插入到所述链表中；否则，放弃该待验视频。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘学，江佳伟，徐开诚，
申请(专利权)人：中国科学院声学研究所，上海尚恩华科网络科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人