The application embodiment provides a video feature extraction method and a device for obtaining a set of second video frames by extracting a plurality of video frames from the target video and obtaining a first video frame set and extracting each of the adjacent frames of each of the video frames. Then, the first video frame set and the second video frame assembly are combined to form a neighboring frame pair input depth convolution network to extract the characteristics of each video frame. Finally, the features of each video frame extracted are computed by the sigmoid activation function, the adjacent frame to the loss function, and the category cross entropy loss function, and the hash feature of the target video is obtained. The video feature expression can better reflect the video content information, and effectively improve the accuracy and efficiency of video feature expression.
【技术实现步骤摘要】
一种视频特征提取方法及装置
本申请涉及视频处理
,具体而言,涉及一种视频特征提取方法及装置。
技术介绍
对视频进行哈希编码可以应用在视频检索、视频聚类、视频压缩等视频相关的领域。现有的视频哈希特征提取方法得到的哈希特征是否有效,是由两个因素决定的,一个因素是提取到的视频特征是否有效代表视频内容,另一因素是哈希算法的准确性。因此,如何设计视频哈希特征的提取方法,使得视频的特征表达更能反映视频的内容信息,提升视频特征表达的精度和利用率,是目前需要研究的一大课题。
技术实现思路
有鉴于此,本申请的目的在于提供一种视频特征提取方法及装置,以使视频的特征表达更能反映视频内容信息,并有效的提高了视频特征表达的精度和利用效率。为了达到上述目的,本申请实施例采用如下技术方案:一方面,本申请提供一种视频特征提取方法,包括:从目标视频中提取多个视频帧得到第一视频帧集合以及提取每个所述视频帧的相邻帧得到第二视频帧集合;将所述第一视频帧集合和第二视频帧集合组合形成邻近帧对集合输入深度卷积网络提取每个视频帧的特征;将提取得到的每个视频帧的特征接入由sigmoid激活函数、邻近帧对损失函数、以及类别交叉熵损失函数构成的视频特征哈希层进行计算,得到所述目标视频的哈希特征;其中,所述邻近帧对损失函数表示如下:其中,f1为所述邻近帧对集合中第一视频帧集合的特征表达,f2为所述邻近帧对集合中第二视频帧集合的特征表达,m为预设的约束因子。另一方面,本申请提供一种视频特征提取装置,包括:邻近帧提取模块,用于从目标视频中提取多个视频帧得到第一视频帧集合以及提取每个所述视频帧的相邻帧得到第二视频帧 ...
【技术保护点】
一种视频特征提取方法,其特征在于,该方法包括:从目标视频中提取多个视频帧得到第一视频帧集合以及提取每个所述视频帧的相邻帧得到第二视频帧集合;将所述第一视频帧集合和第二视频帧集合组合形成邻近帧对集合输入深度卷积网络提取每个视频帧的特征;将提取得到的每个视频帧的特征接入由sigmoid激活函数、邻近帧对损失函数、以及类别交叉熵损失函数构成的视频特征哈希层进行计算,得到所述目标视频的哈希特征;其中,所述邻近帧对损失函数表示如下:
【技术特征摘要】
1.一种视频特征提取方法,其特征在于,该方法包括:从目标视频中提取多个视频帧得到第一视频帧集合以及提取每个所述视频帧的相邻帧得到第二视频帧集合;将所述第一视频帧集合和第二视频帧集合组合形成邻近帧对集合输入深度卷积网络提取每个视频帧的特征;将提取得到的每个视频帧的特征接入由sigmoid激活函数、邻近帧对损失函数、以及类别交叉熵损失函数构成的视频特征哈希层进行计算,得到所述目标视频的哈希特征;其中,所述邻近帧对损失函数表示如下:其中,f1为所述邻近帧对集合中第一视频帧集合的特征表达,f2为所述邻近帧对集合中第二视频帧集合的特征表达,m为预设的约束因子。2.如权利要求1所述的视频特征提取方法,其特征在于,所述从目标视频中提取多个视频帧得到第一视频帧集合以及提取每个所述视频帧的相邻帧得到第二视频帧集合,包括:从所述目标视频中按照预设帧间距提取多个视频帧得到所述第一视频帧集合;从所述目标视频中按照所述预设帧间距提取第一视频帧集合中每个视频帧的相邻帧形成所述第二视频帧集合。3.如权利要求1所述的视频特征提取方法,其特征在于,所述将提取得到的每个视频帧的特征接入由sigmoid激活函数、邻近帧对损失函数、以及类别交叉熵损失函数构成的视频特征哈希层进行计算,得到所述目标视频的哈希特征,的步骤包括:通过所述sigmoid激活函数会将提取得到的每个视频帧的特征映射到0到1的区间,根据设定阈值将sigmoid激活函数的输出映射到二进制编码中形成哈希码并输出。4.如权利要求3所述的视频特征提取方法,其特征在于,该方法还包括:将所述sigmoid激活函数输出的哈希码通过一个类别掩码矩阵生成目标二进制哈希码,所述类别掩码矩阵是一个M*N的矩阵,其中M是预先得到的视频类别个数,N是哈希码长度,每个类别对应一个长为哈希码长度的权重参数;获得所述目标视频所属的类别,并根据该类别获得对应的多个权重参数;将多个所述权重参数取绝对值后进行排序;按照排序结果获取所述目标视频的哈希特征中预设个数的哈希码对应的位置,作为所述目标视频的哈希特征表达的目标位置。5.如权利要求1-4任意一项所述的视频特征提取方法,其特征在于,该方法还包括:计算所述目标视频中目标位置对应的哈希特征与检索数据集中的每个视频中与所述目标位置对应的哈希特征之间的汉明距离;及根...
【专利技术属性】
技术研发人员:刘旭,丁大钧,赵丽丽,
申请(专利权)人:厦门美图之家科技有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。