视频摘要生成方法及系统技术方案

技术编号:20081931 阅读:49 留言:0更新日期:2019-01-15 02:55
本发明专利技术涉及一种视频摘要生成方法及系统,其中,视频摘要生成方法包括依据字典学习和稀疏表示的方法,对视频提取视频帧的特征信息;根据所述特征信息计算相似度;依据相似度对视频进行自适应调整对视频进行分段;根据分段的视频的段内及段间的相似度,自适应地调整相似帧判别标准,并将相似的视频帧进行合并,生成最终的视频摘要。通过使用字典学习和稀疏表示的方法,自适应地调整视频分段地标准,使视频摘要生成方法更加具有适应性。

Video Summary Generation Method and System

The invention relates to a video summary generation method and system, in which the video summary generation method includes extracting feature information of video frames based on dictionary learning and sparse representation, calculating similarity according to the feature information, adaptively adjusting video to segment according to similarity, and according to similarity between segments of video, Similar frame discrimination criteria are adaptively adjusted, and similar video frames are merged to generate the final video summary. By using dictionary learning and sparse representation, the video segmentation standard is adaptively adjusted to make the video summary generation method more adaptable.

【技术实现步骤摘要】
视频摘要生成方法及系统
本专利技术涉及视频处理
,具体涉及一种视频摘要生成方法及系统。
技术介绍
近年来,随着数字摄像设备的普及和网络技术的发展,视频逐渐成为记录人们生活、并进行沟通的一种重要形式,为了节约时间人们希望能够将视频的重要内容提取出来,以便快速了解视频的关键内容,视频摘要就是一种能够满足此需求的技术,视频摘要算法能够根据视频内容,对其各个部分的重要性进行评估,并将更重要的部分提取出来构成视频摘要。然而,视频类型较多,并且内容较为复杂,给视频摘要算法的设计提出了较高的要求,且现有视频摘要的生成方法存在性能不够好,且该方法对不同场景的普适性不强的问题。
技术实现思路
本专利技术的目的是提供视频摘要生成方法及系统。为了解决上述技术问题,本专利技术提供了一种视频摘要生成方法包括:依据字典学习和稀疏表示的方法,对视频提取视频帧的特征信息;根据所述特征信息计算相似度;依据相似度对视频进行自适应调整对视频进行分段;根据分段的视频的段内及段间的相似度,将相似的视频帧进行合并,生成最终的视频摘要。进一步的,所述对视频提取视频帧的特征信息的方法包括:对视频的内容进行预处理和特征提取,以将视本文档来自技高网...

【技术保护点】
1.一种视频摘要生成方法,其特征在于,包括:依据字典学习和稀疏表示的方法,对视频提取视频帧的特征信息;根据所述特征信息计算相似度;依据相似度对视频进行自适应调整对视频进行分段;根据分段的视频的段内及段间的相似度,将相似的视频帧进行合并,生成最终的视频摘要。

【技术特征摘要】
1.一种视频摘要生成方法,其特征在于,包括:依据字典学习和稀疏表示的方法,对视频提取视频帧的特征信息;根据所述特征信息计算相似度;依据相似度对视频进行自适应调整对视频进行分段;根据分段的视频的段内及段间的相似度,将相似的视频帧进行合并,生成最终的视频摘要。2.如权利要求1所述的视频摘要生成方法,其特征在于,所述对视频提取视频帧的特征信息的方法包括:对视频的内容进行预处理和特征提取,以将视频表示成为视频帧的形式;对视频帧进行降采样;对每个所述视频帧进行读入,提取特征信息。3.如权利要求2所述的视频摘要生成方法,其特征在于,所述特征信息包括SIFT特征和HSV特征。4.如权利要求3所述的视频摘要生成方法,其特征在于,所述根据所述特征信息计算相似度的方法包括:对视频提取特征信息之后,每个视频段分别表示为一矩阵;其在对应字典上的重构误差定义如下:||Xi-DAi||2F,其中D表示字典,Ai表示视频帧对应的重构系数,Xi是视频提取的SIFT特征;根据所述重构误差和所述重构系数的变化判断当前视频与之前视频在内容上的差异,根据编码矩阵和空间金字塔,将编码矩阵转换为一个有多尺度信息向量;度量所述多尺度信息向量和n-1,n-2,n-3三帧对应向量的距离,并取其平均值作为当前帧和前面帧的相似度;其中n表示当前帧。5.如权利要求4所述的视频摘要生成方法,其特征在于,所述依据相似度对视频进行自适应调整对视频进行分段的方法包括:根据视频镜头段位置处和视频镜头段内帧间的相似度,计算视频分段的合理阈值,对视频镜头进行分段;根据分段结果,提取每个视频段的视频帧,并且度量视频帧之间的相似度,对分段结果进行自适应调整。6.如权利要求5所述的视频摘要生成方法,其特征在于,所述计算视频分段的合理阈值,对视频镜头进行分段的方法包括:步骤S1,提取数据和特征,将每个图像帧都表示为一个三维特征向量,根据相邻帧之间的相似度数值曲线,提取局部极小值,提取所述极小值位置的数据;步骤S2,对数据进行初始的分类,构建二分...

【专利技术属性】
技术研发人员:曹风云周猛唐杰晓谢飞施培蓓
申请(专利权)人:合肥师范学院
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1