【技术实现步骤摘要】
一种多层级多颗粒度感知编码失真预测方法
[0001]本专利技术属于视频感知编码优化领域,尤其涉及一种多层级多颗粒度感知编码失真预测方法。
技术介绍
[0002]视频数据指数式增长给视频压缩提出更高要求,而基于信息论的视频编码优化已经接近性能瓶颈。事实上,视觉感知机制以及视频编码机制共同决定着压缩视频主观感知质量,因此基于视觉感知的视频编码优化是进一步提高视频压缩效率的有效途径。人眼视觉系统(Human Visual System,HVS)对于一系列不同编码配置的压缩视频仅能察觉出有限的质量层级。换言之,每一个压缩视频质量层级对应的最大编码失真即为该质量层级的恰可感知编码失真(Just Noticeable Coding Distortion,JNCD)阈值,所有编码失真低于该阈值的压缩视频拥有几乎完全一致的主观质量。所以,视频的多层级感知编码失真对于指导视频感知编码具有重要意义。由于视频压缩是一个多模块协同编码过程,不同编码模块的图像处理单位尺寸并不完全一致。所以,对于视频感知编码而言,多层级多颗粒度的感知编码失真预测模型有 ...
【技术保护点】
【技术特征摘要】
1.一种多层级多颗粒度感知编码失真预测方法,其特征在于,包括如下步骤:步骤1:视觉感知效应和感知编码失真映射分析:构建各源视频的多层级恰可感知量化参数数据集和恰可感知编码失真数据集;步骤2:多层级多颗粒度感知编码失真预测:基于视觉感知机制,采用统计分析方法定性分析各视觉感知特征与恰可感知编码失真的映射关系。2.根据权利要求1所述的多层级多颗粒度感知编码失真预测方法,其特征在于,所述步骤1包括如下步骤:步骤1.1:确定感知编码失真标签;步骤1.2:分析感知效应和感知编码失真映射关系。3.根据权利要求2所述的多层级多颗粒度感知编码失真预测方法,其特征在于,所述步骤1.1包括如下具体步骤:视频序列有一系列视频帧组成,相同量化参数QP编码下的不同视频帧主客观质量存在一定差异,所有视频帧的压缩质量共同决定着压缩视频的主观质量,使用公开数据集Videoset,所述数据集Videoset使用H.264/AVC进行编码,包括220个源视频,分为1920
×
1080、1280
×
720、960
×
540和640
×
360四种分辨率,共220
×
4=880个源视频,每个源视频有51个压缩版本,对应着1
‑
51的QP,存在3个质量层级,每个层级均存在一个恰可感知QP,将各层级恰可感知QP对应压缩视频的客观质量作为当前视频多层级感知编码失真标签。4.根据权利要求2所述的多层级多颗粒度感知编码失真预测方法,其特征在于,所述步骤1.2包括如下具体步骤:视觉感知效应是视觉系统对视觉信号的固有特征,不同感知效应对于压缩视频的感知作用并不完全一致,基于一个公开压缩视频数据集MCL
‑
JCV做探索性实验,实验表明亮度自适应掩蔽效应LA在压缩视频感知过程中影响较小,而测量的JNCD阈值与对比掩蔽效应CM和熵掩蔽效应EM具有较高的相关性,相关系数PLCC分别为0.9和0.8,而与亮度自适应掩蔽效应的相关性仅为0.1,采用统建方法分析不同视觉感知效应与感知编码失真的映射关系。5.根据权利要求1所述的多层级多颗粒度感知编码失真预测方法,其特征在于,所述步骤2包括如下步骤:步骤2.1:自适应采样;步骤2.2:感知特征提取;步骤2.3:感知特征融合;步骤2.4:感知编码失真阈值聚合。6.根据权利要求5所述的多层级多颗粒度感知编码失真预测方法,其特征在于,所述步骤2.1包括如下步骤:视频信号JNCD阈值由编码机制和视觉感知机制共同决定,在JNCD预测模型设计中进行视频空时域感知特性分析,分析各视频帧空时域感知效应与感知编码失真之前的定性关系,在JNCD模型训练中对...
【专利技术属性】
技术研发人员:王鸿奎,徐海峰,王贺,殷海兵,
申请(专利权)人:杭州电子科技大学丽水研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。