一种基于Spark和深度哈希的视频并行检索方法技术

技术编号:24996230 阅读:46 留言:0更新日期:2020-07-24 17:58
本发明专利技术公开了一种基于Spark和深度哈希的视频并行检索方法,先对原始视频数据集进行基于CNN的视频关键帧图像深度特征提取,得到视频摘要图像深度特征集;然后对视频摘要图像深度特征集进行基于分布式哈希的视频关键帧图像特征量化,得到图像分布式编码特征集和编码查找本;最后对待检索图像采用基于Spark的视频并行检索,通过基于Spark的分布式计算结合编码查找本,最终返回检索到的最近似图像所在的视频。本发明专利技术能在保证视频检索准确性的前提下,有效提高检索的计算效率,进而提高了视频检索的速度。

【技术实现步骤摘要】
一种基于Spark和深度哈希的视频并行检索方法
本专利技术涉及一种视频并行检索方法,具体是一种基于Spark和深度哈希的视频并行检索方法。
技术介绍
在大规模视频数据的检索过程中,传统的串行遍历检索模式已经出现瓶颈,也增大了检索系统的负担。分布式平台Hadoop的出现提高了大规模视频检索的速度和效率,但大部分研究主要采用的MapReduce并行模型在磁盘中进行运算,与基于内存的分布式计算引擎Spark模型相比,Spark每个作业中间输出的结果可以存储在内存中,无需读写HDFS(即分布式文件系统)。因此,Spark模型可以更好地适应视频检索过程中的迭代匹配的过程,从而提高检索速度。在视频图像特征提取方面,基于内容的视频检索最初主要通过对特定场景用主观判断手动提取特征,如:纹理、边缘、形状、颜色特征等单个或多个特征的融合,这种方式很容易导致图像特征提取不完整。卷积神经网络(ConvolutionalNeuralNetworks,CNN)的出现提供了一种隐式自动学习的图像特征提取方案;基于CNN的深度特征不仅能够保留更多图像细节信息,在图像特本文档来自技高网...

【技术保护点】
1.一种基于Spark和深度哈希的视频并行检索方法,其特征在于,具体步骤为:/n步骤一、基于CNN的视频关键帧图像深度特征提取:对原始视频数据集进行关键帧提取获得视频摘要数据集;先从视频摘要数据集中划分出训练集,然后基于VGG网络和PWA算法进行加权聚合筛选,筛选过程中利用无监督策略选择部分卷积层滤波器生成概率权值方案,通过聚合对应各语义内容的加权区域表示获取最终的特征表示;筛选出最终特征向量,从而根据最终特征向量构成深度特征提取模型;最后根据深度特征提取模型对视频摘要数据集处理后生成视频摘要图像深度特征集;/n步骤二、基于分布式哈希的视频关键帧图像特征量化:根据视频摘要图像深度特征集,先从其...

【技术特征摘要】
1.一种基于Spark和深度哈希的视频并行检索方法,其特征在于,具体步骤为:
步骤一、基于CNN的视频关键帧图像深度特征提取:对原始视频数据集进行关键帧提取获得视频摘要数据集;先从视频摘要数据集中划分出训练集,然后基于VGG网络和PWA算法进行加权聚合筛选,筛选过程中利用无监督策略选择部分卷积层滤波器生成概率权值方案,通过聚合对应各语义内容的加权区域表示获取最终的特征表示;筛选出最终特征向量,从而根据最终特征向量构成深度特征提取模型;最后根据深度特征提取模型对视频摘要数据集处理后生成视频摘要图像深度特征集;
步骤二、基于分布式哈希的视频关键帧图像特征量化:根据视频摘要图像深度特征集,先从其中划分出哈希编码模型训练集,并根据哈希编码模型训练集进行哈希乘积量化编码,从而完成分布式哈希编码模型的训练;根据已完成训练的分布式哈希编码模型对视频摘要图像深度特征集处理后生成图像分布式编码特征集;并根据图像分布式编码特征集生成编码查找本;
步骤三、基于Spark的视频并行检索:首先利用深度特征提取模型对输入待检索的图像进行图像特征向量提取;然后利用分布式编码模型将提取的图像特征向量生成图像哈希编码;通过基于Spark的分布式计算结合编码查找本进行并行检索,获得图像分布式编码特征集中最近的聚类中心,再根据线性重排,最终返回检索到的最近似图像所在的视频。


2.根据权利要求1所述的一种基于Spark和深度哈希的视频并行检索方法,其特征在于,所述步骤一的具体过程为:
(1)对于原始视频数据集,首先传递到预训练的深度网络VGG-16模型提取深度卷积层特征f,所述深度卷积层特征f由C个通道特征图组成,每个特征图高度为H、宽度为W;并通过N个筛选出来的部分判别检测器加权聚合表示,即为N*C维的矢量表示;
(2)选择基于视频摘要数据集训练出部分判别检测器,选择具有更大差异的特征图通道,因此通过计算每个通道特征的方差进行筛选,C维向量gi(i=1,2,...,D)的C通道方差V={v1,v2,...,vc,...,vC}:



(3)对C通道的方差{v1,v2,...,vC}进行排序,选择方差最大的前N个判别式卷积层滤波器作为部分判别检测器;然后,通过无监督策略生成概率权值方案,每个概率权值方案都对应于隐含的固定语义内容,通过选择概率权值方案加权PWA表示,构造具有高度H和宽度W的C×W×H维深度卷积特征f的加权和集:



系数wn是归一化权重,其数值由部分判别检测器生成的所选概率权值方案的位置(x,y)中的激活值vn(x,y)确定:



其中α和β分别是功率归一化和功率缩放的参数;
(4)从加权和池化过程获得N个选择的C维区域表示ψn(I),进而通过连接选定的区域表示得到全局N×C维表示向量ψ(I):
ψ(I)...

【专利技术属性】
技术研发人员:卑璐璐赵文婧厉丹黄凯
申请(专利权)人:徐州工程学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1