当前位置: 首页 > 专利查询>浙江大学专利>正文

一种视频处理方法及装置制造方法及图纸

技术编号:12018863 阅读:55 留言:0更新日期:2015-09-09 15:47
本发明专利技术的实施例提供一种视频处理方法及装置,涉及多媒体处理技术领域,能够有效提高视频编码的效率。该方法包括:将待编码视频分割为至少两段场景;将各段场景划分为至少两个场景类别;从至少两个场景类别中的至少一个场景类别中分别选取出至少一幅图像;保存选取出的图像,以生成知识库。

【技术实现步骤摘要】

本专利技术设及多媒体处理
,尤其设及一种视频处理方法及装置
技术介绍
随着多媒体技术和互联网的快速发展,视频信息越来越多。相应的,对视频的处理 显得越来越重要。视频编码是其中的一种关键技术,近年来受到人们越来越多的关注和重 视。 为了提高视频编码的效率,现有技术中存在一种基于图像库进行视频编码的方 法,即将待编码视频中的图像与图像库中的预存储图像进行比较得到区别图像及相同图 像,然后对区别图像进行编码W及相同图像所对应的属性信息进行编码。 但是,上述方法中提到的图像库通常是预先对各种类型的人物、物体或动画、片段 等数据进行采集,获取大量丰富的图片或图像的数据并存储在数据库中形成的。该图像库 中的数据与待编码视频中的图像的相关性较小,且该图像库中的数据容易出现多个数据之 间存在较高相关性的问题,即图像库中的数据冗余较大。另外,将该样的图像库传输到解码 端,将会耗费大量比特。因此,基于该样的图像库进行视频编码时,依旧会限制视频编码的 效率。
技术实现思路
本专利技术的实施例提供一种视频处理方法及装置,通过分析待编码视频,构建出与 待编码视频相关性较大且内部数据之间冗余较小的知识库,进而利用该知识库对待编码视 频进行编码,可有效的解决视频编码效率较低的问题。 为达到上述目的,本专利技术的实施例采用如下技术方案: 第一方面,本专利技术实施例提供了一种视频处理方法,该方法包括; 将待编码视频分割为至少两段场景; 将各段场景划分为至少两个场景类别; 从所述至少两个场景类别中的至少一个场景类别中分别选取出至少一幅图像; 保存选取出的图像,W生成知识库。 在第一方面的第一种可能的实现方式中,所述选取出的图像中任意两幅图像之间 的相似度低于第一预设阔值。 在第一方面的第二种可能的实现方式中,所述将各段场景划分为至少两个场景类 另0,包括: 每段场景为一个场景类别; 或者, 检测至少一段场景和其不相邻场景的相似度,并将相似度大于或等于第二预设阔 值的场景划分为同一个场景类别。 结合第一方面的第二种可能的实现方式,在第一方面的第=种可能的实现方式 中,所述检测至少一段场景和其不相邻场景的相似度,包括:[001引从各段场景中分别选取一幅代表图像; 计算任意两段不相邻场景的代表图像之间的相似度;所述相似度使用两幅图像之 间的图像差、特征描述子相似度或运动补偿残差中的一种来衡量。 在第一方面的第四种可能的实现方式中,所述从所述至少两个场景类别中的至少 一个场景类别中分别选取出至少一幅图像,包括: 选取第一场景类别中任意一段场景的第一预设位置的图像,所述第一场景类别为 所述至少一个场景类别中的任意一个场景类别;[002引或者,根据所述第一场景类别中各段场景的活动性选取图像,所述活动性使用运动矢量 强度、图像差、运动补偿残差或者图像特征变化中的至少一种来衡量;其中,所述图像特征 至少包括亮度直方图、色度直方图、特征描述子中的一种,所述特征描述子至少包括尺度不 变转换SIFT特征描述子、加速稳健特征SURF特征描述子中的一种。 结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式 中,所述第一预设位置属于所述待编码视频中的随机访问点。在第一方面的第六种可能的实现方式中,所述保存选取出的图像,W生成知识库, 具体包括:对选取出的图像进行编码,生成重建图像;保存重建图像,W生成知识库。 结合第一方面的第四种可能的实现方式,在第一方面的第走种可能的实现方式 中,所述根据所述第一场景类别中各段场景的活动性选取图像,包括: 计算所述第一场景类别中每段场景的活动性;根据所述每段场景的活动性,确定每段场景中需要选取图像的数量; 采用第一预设选取规则,在每段场景中选取图像,所述选取图像的数量与所述需 要选取图像的数量相同。 结合第一方面的第走种可能的实现方式,在第一方面的第八种可能的实现方式 中,当第一场景类别中只包含有一段场景,且在该段场景中需要选取图像的数量为零时,贝U 将所述第一场景类别需要选取图像的数量修改为一;当所述第一场景类别中包含至少两段场景,且所有场景中需要选取图像的数量均 为零时,则将所述第一场景类别中其中一段场景需要选取图像的数量修改为一。 结合第一方面的第走种可能的实现方式或第八种可能的实现方式,在第一方面的 第九种可能的实现方式中,每段场景中需要选取图像的数量和该段场景的活动性呈单调递 增关系,但每段场景中需要选取图像的数量不超过第=预设阔值。 结合第一方面的第走种可能的实现方式,在第一方面的第十种可能的实现方式 中,所述采用第一预设选取规则,在每段场景中选取图像,包括:根据选取图像的数量,等间隔或近似等间隔地从场景中选取出相应数量的图像。 结合第一方面的第四种可能的实现方式,在第一方面的第十一种可能的实现方式 中,所述根据所述第一场景类别中各段场景的活动性选取图像,包括: 计算所述第一场景类别中位于第二预设位置的图像的活动性; 根据各个位于第二预设位置的图像的活动性和第二预设选取规则,选取所述第一 场景类别中的图像。 结合第一方面的第十一种可能的实现方式,在第一方面的第十二种可能的实现方 式中,所述根据各个位于第二预设位置的图像的活动性和第二预设选取规则,选取所述第 一场景类别中的图像,包括: 从第一幅位于第二预设位置的图像开始,累积各幅位于第二预设位置的图像的活 动性; 当活动性累积达到第四预设阔值时,选取对应位置的图像; 将活动性清零,从选取出的图像所在位置的下一个第二预设位置开始重复上述累 积活动性、达到第四预设阔值时选取对应位置图像的过程,直到遍历完所述第一场景类别 中所有位于第二预设位置的图像。 结合第一方面的第十一种可能的实现方式,在第一方面的第十=种可能的实现方 式中,所述第二预设位置属于所述待编码视频中的随机访问点。 结合前述第一方面或第一方面的第一种可能的实现方式至第十=种可能的实现 方式中的任意一种可能的实现方式,在第一方面的第十四种可能的实现方式中,所述选取 出的图像属于所述待编码视频中的随机访问点所在的图像。 结合第一方面的第五种可能的实现方式或第十=种可能的实现方式至第十四种 可能的实现方式中的任意一种可能的实现方式,在第一方面的第十五种可能的实现方式 中,所述待编码视频中的随机访问点所在的图像采用帖内编码,或者仅参考知识库中的至 少一幅图像采用帖间编码。 结合前述第一方面或第一方面的第一种可能的实现方式至第十五种可能的实现 方式中的任意一种可能的实现方式,在第一方面的第十六种可能的实现方式中,所述方法 还包括: 获取当前图像,所述当前图像为所述待编码视频中至少一幅图像; 从所述知识库中选择所述当前图像的至少一幅参考图像; 根据所述至少一幅参考图像对所述当前图像进行编码。 结合第一方面的第十六种可能的实现方式,在第一方面的第十走种可能的实现方 式中,所述当前图像至少包括所述待编码视频中至少一个随机访问点所在的图像。 结合第一方面的第十六种可能的实现方式,在第一方面的第十八种可能的实现方 式中,从所述知识库中选择所述当前图像的至少一幅参考图像,包括: 将所述当前图像和所述知识库中至少一幅图像进行相似度比较; 选取相似度超过第五预设阔值的N幅图像作为当前图像的参考图本文档来自技高网...
一种视频处理方法及装置

【技术保护点】
一种视频处理方法,其特征在于,包括:将待编码视频分割为至少两段场景;将各段场景划分为至少两个场景类别;从所述至少两个场景类别中的至少一个场景类别中分别选取出至少一幅图像;保存选取出的图像,以生成知识库。

【技术特征摘要】

【专利技术属性】
技术研发人员:虞露左旭光赵寅杨海涛
申请(专利权)人:浙江大学华为技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1