一种视频去重方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24799699 阅读:26 留言:0更新日期:2020-07-07 21:04
本发明专利技术实施例公开了一种视频去重方法、装置、计算机设备和存储介质,该方法包括:获取多个原始视频数据;从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;从所述第三候选视频数据中选择作为视频代表的目标视频数据。设置由粗到精逐步细化的三个筛选层次,扩展性好,以此来筛选内容重复的视频数据,在保证精确度的同时,逐步减少视频数据的数量,从而减少运算量,提高筛选的效率。

【技术实现步骤摘要】
一种视频去重方法、装置、计算机设备和存储介质
本专利技术实施例涉及视频处理的技术,尤其涉及一种视频去重方法、装置、计算机设备和存储介质。
技术介绍
随着移动互联网技术的发展,短视频类的应用广发普及,用户随时随地可制作并上传大量视频至平台,平台从中挑选出可能会受观众喜欢的视频,向观众推送。但是,用户上传的视频中可能存在高度相似甚至雷同的重复的视频,这些重复的视频主要来自从其他平台搬运、一稿多投、模仿跟风等途径。对观众用户来说,如推送的视频中存在重复视频,则会降低推送视频的多样性,使观众用户容易对内容产生厌倦,降低用户的观看积极性。对投稿用户来说,如模仿、搬运热门视频容易被推送,则会挫伤创作的积极性。因此,去除重复视频,有利于提高观众观看内容的多样性,提升观众用户的体验,同时,让原创内容获得更多的展示机会,能引导投稿用户创作原创内容,减少模仿跟风、直接搬运的投稿,有利于保护和鼓励原创内容,提高用户投稿的积极性。由于深度学习的识别准确率较高,因此,目前平台多使用深度神经网络判断视频是否重复,即利用既存的或新训练的深度神经网络,提取视频特征并判断视频是否重复。但是,深度神经网络计算量巨大,时间和设备成本较高,可扩展性较低,难以应对迅速增长的海量视频。
技术实现思路
本专利技术实施例提供一种视频去重方法、装置、计算机设备和存储介质,以解决视频去重的时间和设备成本较高,可扩展性较低,难以应对迅速增长的海量视频的问题。第一方面,本专利技术实施例提供了一种视频去重方法,包括:获取多个原始视频数据;从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;从所述第三候选视频数据中选择作为视频代表的目标视频数据。可选地,所述从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据,包括:从所述原始视频数据中提取视频图像数据;从所述视频图像数据中提取静态图像特征;计算所述静态图像特征之间的第一差异度;若所述第一差异度小于预设的第一阈值,则确定所述静态图像特征所属的原始视频数据为第一候选视频数据。可选地,所述从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据,包括:从所述第一候选视频数据中提取视频图像数据;从所述视频图像数据中提取图像纹理特征;将所述图像纹理特征组合为视频纹理特征;计算所述视频纹理特征之间的第二差异度;若所述第二差异度小于预设的第二阈值,则确定所述固定的视频特征所属的第一候选视频数据为第二候选视频数据。可选地,所述从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据,包括:从所述第二候选视频数据中提取视频图像数据;将所述视频图像数据输入预置的特征学习模型中,以学习图像动作特征;将所述图像动作特征输入预置的特征生成模型中,以学习视频动作特征;计算所述视频动作特征之间的第三差异度;若所述第三差异度小于预设的第三阈值,则确定所述视频动作特征所属的第二候选视频数据为第三候选视频数据。可选地,所述从所述第三候选视频数据中选择作为视频代表的目标视频数据,包括:将所述第三候选视频数据聚合为视频簇;从所述视频簇中选择作为视频代表的目标视频数据。可选地,所述将所述第三候选视频数据聚合为视频簇,包括:将所述第三候选视频数据转换为无向有权图;其中,所述无向有权图中的节点为所述第三候选视频数据,所述节点之间的边为所述第三候选视频数据之间的第三差异度;合并具有相同边的节点,获得视频簇。可选地,所述从所述视频簇中选择作为视频代表的目标视频数据,包括:在所述视频簇中,查找所述第三候选视频数据对应的用户操作数据;依据所述用户操作数据从所述第三候选视频数据中确定作为视频代表的目标视频数据。第二方面,本专利技术实施例还提供了一种视频去重装置,包括:原始视频数据获取模块,用于获取多个原始视频数据;第一候选视频数据筛选模块,用于从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;第二候选视频数据筛选模块,用于从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;第三候选视频数据筛选模块,用于从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;目标视频数据选择模块,用于从所述第三候选视频数据中选择作为视频代表的目标视频数据。可选地,所述第一候选视频数据筛选模块包括:第一视频帧提取子模块,用于从所述原始视频数据中提取视频图像数据;静态图像特征提取子模块,用于从所述视频图像数据中提取静态图像特征;第一差异度计算子模块,用于计算所述静态图像特征之间的第一差异度;第一候选视频数据确定子模块,用于若所述第一差异度小于预设的第一阈值,则确定所述静态图像特征所属的原始视频数据为第一候选视频数据。可选地,所述第二候选视频数据筛选模块包括:第二视频帧提取子模块,用于从所述第一候选视频数据中提取视频图像数据;静态纹理特征提取子模块,用于从所述视频图像数据中提取图像纹理特征;视频纹理特征组合子模块,用于将所述图像纹理特征组合为视频纹理特征;第二差异度计算子模块,用于计算所述视频纹理特征之间的第二差异度;第二候选视频数据确定子模块,用于若所述第二差异度小于预设的第二阈值,则确定所述固定的视频特征所属的第一候选视频数据为第二候选视频数据。可选地,所述第三候选视频数据筛选模块包括:第三视频帧提取子模块,用于从所述第二候选视频数据中提取视频图像数据;图像动作特征学习子模块,用于将所述视频图像数据输入预置的特征学习模型中,以学习图像动作特征;视频动作特征学习子模块,用于将所述图像动作特征输入预置的特征生成模型中,以学习视频动作特征;第三差异度计算子模块,用于计算所述视频动作特征之间的第三差异度;第三候选视频数据确定子模块,用于若所述第三差异度小于预设的第三阈值,则确定所述视频动作特征所属的第二候选视频数据为第三候选视频数据。可选地,所述目标视频数据选择模块包括:视频数据聚合子模块,用于将所述第三候选视频数据聚合为视频簇;视频簇选择子模块,用于从所述视频簇中选择作为视频代表的目标视频数据。可选地,所述视频数据聚合子模块包括:无向有权图转换单元,用本文档来自技高网...

【技术保护点】
1.一种视频去重方法,其特征在于,包括:/n获取多个原始视频数据;/n从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;/n从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;/n从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;/n从所述第三候选视频数据中选择作为视频代表的目标视频数据。/n

【技术特征摘要】
1.一种视频去重方法,其特征在于,包括:
获取多个原始视频数据;
从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;
从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;
从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;
从所述第三候选视频数据中选择作为视频代表的目标视频数据。


2.根据权利要求1所述的方法,其特征在于,所述从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据,包括:
从所述原始视频数据中提取视频图像数据;
从所述视频图像数据中提取静态图像特征;
计算所述静态图像特征之间的第一差异度;
若所述第一差异度小于预设的第一阈值,则确定所述静态图像特征所属的原始视频数据为第一候选视频数据。


3.根据权利要求1所述的方法,其特征在于,所述从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据,包括:
从所述第一候选视频数据中提取视频图像数据;
从所述视频图像数据中提取图像纹理特征;
将所述图像纹理特征组合为视频纹理特征;
计算所述视频纹理特征之间的第二差异度;
若所述第二差异度小于预设的第二阈值,则确定所述固定的视频特征所属的第一候选视频数据为第二候选视频数据。


4.根据权利要求1所述的方法,其特征在于,所述从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据,包括:
从所述第二候选视频数据中提取视频图像数据;
将所述视频图像数据输入预置的特征学习模型中,以学习图像动作特征;
将所述图像动作特征输入预置的特征生成模型中,以学习视频动作特征;
计算所述视频动作特征之间的第三差异度;
若所述第三差异度小于预设的第三阈值,则确定所述视频动作特征所属的第二...

【专利技术属性】
技术研发人员:张锐刘运刘汇川梁柱锦
申请(专利权)人:广州市百果园信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1