【技术实现步骤摘要】
一种基于视觉注意力模型的关键帧提取方法和系统
本专利技术涉及视频分析
,特别是涉及一种基于视觉注意力模型的关键帧提取方法和系统。
技术介绍
随着互联网技术的快速发展,我们已经迈入了信息大爆炸时代,各种各样的网络应用和多媒体技术的快速发展得到了广泛的应用。视频作为一种常见的网络信息载体,生动而直观,具有很强的观赏性和表现力,从而在各个领域得到了广泛的应用,使得视频数据海量增长,以著名的视频网站YouTube为例,每分钟由用户上传的视频约有60小时(数据取自2012年1月23日),而且依然保持着增长趋势。如何快速有效地存储、管理和访问海量的视频资源成为当前视频应用领域的一个重要问题。视频因为具有时域相关性,传统方式下,用户掌握一段视频信息需要自始至终浏览完整段视频。无关视频占据用户大量时间的同时,也浪费了大量网络带宽。因此,我们需要对视频添加辅助信息,帮助用户更好地筛选。目前成熟的系统中普遍采用传统的文字标注法,通过人工方式手动分类,用标题、描述等文字赋予视频人工语义。面对海量视频,这项任务不但工作量大,而且不同的人对视频理解不同,其他人无法通过作者的文字标注判断视频是否符合自己的兴趣。因此,人们迫切需要一种自动化的方式对视频进行有效地概括。
技术实现思路
为了解决现有技术的不足,本专利技术首先提供一种基于视觉注意力模型的视频关健帧提取方法,采用该方法能够有效的获得对视频镜头具有很好代表性的关键帧。本专利技术的又一目的是提出一种基于视觉注意力模型的视频关健帧提取系统。为了实现上述目的,本专利技术的技术方案为:一种基于视觉注意力模型的视频关键帧提取方法,包括: ...
【技术保护点】
一种基于视觉注意力模型的关键帧提取方法,用于对视频的关键帧进行提取,其特征在于,包括:在空域上,用二项式系数滤波全局对比度进行显著度检测,并且利用自适应阈值对目标区域进行提取;在时域上,定义运动的显著度,通过单应性矩阵对目标运动进行估计,采用关键点代替目标进行显著度检测,融合空域显著度的数据,提出基于能量函数边界扩展的方法获得包围盒作为时域的显著目标区域;通过显著目标区域降低视频的丰富性,采用结合在线聚类的镜头自适应方法进行关键帧提取。
【技术特征摘要】
1.一种基于视觉注意力模型的关键帧提取方法,用于对视频的关键帧进行提取,其特征在于,包括:在空域上,用二项式系数滤波全局对比度进行显著度检测,并且利用自适应阈值对目标区域进行提取;在时域上,定义运动的显著度,通过单应性矩阵对目标运动进行估计,采用关键点代替目标进行显著度检测,融合空域显著度的数据,提出基于能量函数边界扩展的方法获得包围盒作为时域的显著目标区域;通过显著目标区域降低视频的丰富性,采用结合在线聚类的镜头自适应方法进行关键帧提取;在空域上,通过用二项式系数滤波全局对比度进行显著度检测,并且利用自适应阈值对目标区域进行提取,具体方法如下:(11)二项式系数按照杨辉三角构造,N层的归一化因子为2N;选择第四层,滤波器系数B4=(1/16)[14641];(12)设I为原刺激强度,为周围刺激强度的均值,为I与B4的卷积;将像素点采用CIELAB颜色空间的向量形式衡量刺激的强弱,刺激的对比度即为两CIELAB向量的欧式距离,因此对于像素点(x,y)的刺激度检测为(13)得到显著度的测量集合Ss=(s11,s12,…,sNM)后,利用自适应阈值对目标区域进行提取,其中sij为像素点(i,j)的显著度,0≤i≤N,0≤j≤M,M,N分别为图像的宽度和高度;通过以下方法实现自适应阈值对目标区域进行提取:(21)定义像素点(x,y)全局显著度检测计算式其中A为检测的面积,为原图像经滤波器B4滤波后像素点(x,y)的刺激强度,I(i,j)为像素点(i,j)的原刺激强度,M,N分别为图像的宽度和高度;(22)通过直方图进行运算加速,将原刺激强度I映射到刺激空间中,最终对于用户感受到的刺激的显著度如下所示其中D为刺激在m个最近刺激之间的距离(23)通过改变阈值Ts指定前景和背景区域,然后以获得最小的能量函数的阈值作为最优阈值;以Ts为阈值的能量函数的定义如下:其中Sn由公式(2)获得,λ为显著目标能量的权重,N为图像的总像素数,f(Ts,Sn)=max(0,sign(Sn-Ts)),V(I,Ts,σ)为对周围刺激的相似度的衡量,选择当前Ts下显著点和其8邻域的像素点组成点对Pair进行计算,dist(p,q)为两点之间的空间距离,σ为控制参数。2.根据权利要求1所述的方法,其特征在于,在时域上,定义运动的显著度,通过单应性矩阵对目标运动进行估计,采用关键点代替目标进行显著度检测,之后融合空域显著度的数据,提出基于能量函数边界扩展的方法获得包围盒作为时域的显著目标区域,具体方法如下:(31)给定一幅图像,采用实时性好的FAST特征点检测算法获得图像的关键点;(32)给定相邻的两帧图像,采用FLANN进行快速的相关点匹配;(33)用多个单应性矩阵H来描述关键点的运动,采用RANSAC算法,通过不断迭代,获得一系列单应性矩阵的估计H={H1,H2,...,Hn};(34)定义关键点的时域显著度为其中Am为运动状态Hm的所有关键点的分布面积,W和H为视频图像的宽度和高度;(35)采用基于能量函数边界扩展的方法获得包围盒作为时域的显著目标区域。3.根据权利要求2所述的方法,其特征在于,通...
【专利技术属性】
技术研发人员:纪庆革,赵杰,刘勇,
申请(专利权)人:中山大学,广州中大南沙科技创新产业园有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。