一种基于深度卷积网络的视频内容检索方法技术

技术编号：23050293 阅读：16 留言：0更新日期：2020-01-07 14:48

本发明专利技术公开了一种基于深度卷积网络的视频内容检索方法，通过深度学习的方法对视频进行分类，提取出网络模型，将模型移动至个人数据库，然后设计一个Html静态页面作为视频内容检索系统的检索模块，提出python运行功能、检索功能、文本显示功能三种要求，实现视频分类模块和视频内容检索模块的对接；该发明专利技术集合视频分类与视频检索与整体系统，能够在检索视频输入到系统自动给视频打上一个内容标签，同时可以检索出与视频相关的一类视频，达到实时输入，实时检索的效果。

A video content retrieval method based on deep convolution network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度卷积网络的视频内容检索方法
本专利技术涉及视频处理
，具体涉及一种基于深度卷积网络的视频内容检索方法。
技术介绍
如今视频数量爆炸式增加，视频包含的内容也越来越丰富。用户对视频的需求也发生了很大变化，从每个视频简单的观看，到视频内容指定片段的搜索、视频内容的分析等。因此，面对如此之多的视频数据，创建一个视频内容检索系统，使用户从海量的视频中精确地查找包含指定片段的视频片段，具有广阔的应用前景。目前想要找到视频中的特定片段的话，通常是按标签对具有共性的内容进行合并，这是传统的视频分类形式。然而，这种分类形式需要人工分类，先观看整部视频，再截取特定片段从而做成一个集锦。传统的视频分类形式是以整部视频为单位，对整部视频添加名称或者备注，通过检索视频名称或备注信息进行分类，效率比较低下。也有应用深度学习应用于视频检索，其通过使用相似度学习或者是基于原始的文本学习，对比相似度的差异，实现分类效果，例如：在专利文献CN108228915A中，华南理工大学提出一种基于深度学习的视频检索，其方法使用长短记忆网络对预处理的视频进行特征提取，最后通过相似度计算并排序，得到视频检索的结果。该文是基于对视频进行分析，提取关键帧信息，同时对训练分类的关键帧和检索视频的关键帧的对比，即基于视频内容的检索。但是该方法在对视频再一次做关键帧的对比会加大计算量，使运行的时间加长。在专利文献CN109783691A中，四川远鉴科技有限公司提出一种基于深度学习和哈希编码的视频检索方法，其特征在于使用同一种特征进行镜头分割...

【技术保护点】
1.一种基于深度卷积网络的视频内容检索方法，其特征在于，包括下述步骤：/nS1，视频的分类：/n确定所需检索的视频，通过网络爬虫或者网上数据下载，查找到所有与所需检索视频相关的视频信息及内容，通过深度卷积神经网络对所有视频进行分类；采用LSTM长短期记忆网络对所有视频数据进行分类处理；/nS1.1，将收集的视频按比例分成训练集和测试集，并将训练集视频切割成一张张关键帧的视频图像，将所有关键帧放置对应文件夹下；/nS1.2，将所有关键帧图像通过Inception模块遍历，然后在Inception模块网络的最终池化层即保存输出，不做最后的网络分类；然后将每个图像提取的特征整合，每40个帧特征整合为一个序列并保存至数据硬盘中；/nS1.3，将每个视频的序列按顺序输入到LSTM长短期记忆网络中，长短期记忆网络通过遗忘门、输入门和输出门决定信息的有用与否，并决定是否抛弃；遗忘门公式如下所示：/nf

【技术特征摘要】
1.一种基于深度卷积网络的视频内容检索方法，其特征在于，包括下述步骤：
S1，视频的分类：
确定所需检索的视频，通过网络爬虫或者网上数据下载，查找到所有与所需检索视频相关的视频信息及内容，通过深度卷积神经网络对所有视频进行分类；采用LSTM长短期记忆网络对所有视频数据进行分类处理；
S1.1，将收集的视频按比例分成训练集和测试集，并将训练集视频切割成一张张关键帧的视频图像，将所有关键帧放置对应文件夹下；
S1.2，将所有关键帧图像通过Inception模块遍历，然后在Inception模块网络的最终池化层即保存输出，不做最后的网络分类；然后将每个图像提取的特征整合，每40个帧特征整合为一个序列并保存至数据硬盘中；
S1.3，将每个视频的序列按顺序输入到LSTM长短期记忆网络中，长短期记忆网络通过遗忘门、输入门和输出门决定信息的有用与否，并决定是否抛弃；遗忘门公式如下所示：
ft＝σ(Wf[ht-1,xt]+bf)，
其中ht-1为前一序列的输出，xt为当前序列的输入，Wf和bf为遗忘门的权重与偏置，通过Sigmoid函数学习到一个0～1的遗忘数字，1代表完全保留，0代表彻底删除；
输入门公式如下所示：
it＝σ(Wi[ht-1,xt]+bi)，
C′t＝tanh(Wc[ht-1,xt]+bc)，
其中Wi、bi、Wc、bc为记忆层和输入层的权重与偏置，先通过Sigmoid函数学习一个需要更新的数据的记忆数字，然后通过tanh函数创建候选向量，该向量会被加入到细胞的状态中；状态更新公式如下所示：...

【专利技术属性】
技术研发人员：叶武剑，江齐，刘怡俊，刘文杰，翁韶伟，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人