The invention discloses a content based bitstream video quality evaluation model, which belongs to the multimedia technology field. The compressed domain model can extract video parameters directly from the bitstream, and is used for real-time non intrusive quality monitoring. The model mainly aims at the H.264 video coding standard, which is used for the quality evaluation of coding distortion. Establish the basic relationship between perceived quality and quantization parameter QP. Considering the obvious dependence of perceptual quality on video content, video content is defined as a combination of different time complexity and spatial complexity. The invention uses the proportion of SPM_Ratio in small size prediction blocks, and an average of 4 x 4 blocks in I frame including the proportion of DCT non zero numbers Ave_Coef, and also describes the spatial complexity of the video. The spatial complexity of video is described by using the normalization parameter Ave_Mvlen of the motion vector information suffix length average. All information can be extracted directly from the bitstream without decoding operation.
【技术实现步骤摘要】
基于内容的比特流层视频质量评价模型
本专利技术提出了一种基于压缩域的视频质量评价模型,属于多媒体
技术介绍
近年来,随着多媒体技术的蓬勃发展,网络视频服务,可视电话,IPTV等在我们的日常生活中已经获得明显的普及。然而,这些应用的质量时常无法得到实时的监控和保证。因此,建立一种网络视频质量评估的客观模型变得非常有必要。从是否需要原始视频信息的角度来讲,视频质量评价可以分为主观评价和客观评价两种。主观评价需要受测者在特定环境下,观察一系列的被测视频,按照事先规定的评分标准进行评分。主要的方法有:DSIS(DoubleStimulusImpairmentScale)法,DSCQS(DoubleStimulusContinuousQualityScale)法,SSIM(SingleStimulusMethods)法,SSCQE(SingleStimulusContinuousQualityEvaluation)法。主观评价方法最常用的打分标准是MOS标准,MOS分数由5到1代表感知质量越来越差。主观评价是能最直接反映人对视频质量的感知水平的方法,但缺点是主观实验费时费力,且容易受到观察者自身认知水平的影响。客观评价一般通过数学计算的方法来对视频序列进行打分。根据对原始视频的依赖程度不用,又可以分为3类:全参考、部分参考、无参考。全参考模型需要原始视频的全部信息,常用的方法有PSNR、SSIM、MS-SSIM等。全参考模型需要评估完整的原始视频信息,也就是未经压缩的像素数据,这个量级的数据一般是无法实时传输的,这也就导致无法远程实时监控和评估视频质量。为 ...
【技术保护点】
1.基于内容的比特流层视频质量评价模型,其特征在于:该模型的实施包括以下步骤:S1.感知质量与量化参数由于H.264是基于块的DCT压缩方法,块失真是最主要的编码失真,在H.264/AVC编码标准中有52个量化步长Qstep值,通过量化参数QP索引,每隔6个QP,Qstep就增长一倍;Qstep=2(Qp‑4)/6 (1)Qstep是由QP决定的,因此,QP是反映编码失真的关键参数,选取四组标准测试视频序列,用恒定QP进行编码;通过改变QP值,获得对应的MOS分数值;该关系可以被描述为一个倒S的曲线,在QP较小时MOS下降不大,之后MOS快速下降,而最后趋于平滑且取值接近;不同的视频形状各不相同;四组标准测试视频序列分别为足球,电影,工头,母女;即Football,Mobile,Foreman,mother_daugher;具有更高纹理丰富度即空间信息和运动剧烈度即时间信息的视频,Football,Mobile在相同QP条件下,具有相对较高的感知质量;相应地,Mother_daugher的运动剧烈度和纹理丰富度较低,在相同QP条件下感 ...
【技术特征摘要】
1.基于内容的比特流层视频质量评价模型,其特征在于:该模型的实施包括以下步骤:S1.感知质量与量化参数由于H.264是基于块的DCT压缩方法,块失真是最主要的编码失真,在H.264/AVC编码标准中有52个量化步长Qstep值,通过量化参数QP索引,每隔6个QP,Qstep就增长一倍;Qstep=2(Qp-4)/6(1)Qstep是由QP决定的,因此,QP是反映编码失真的关键参数,选取四组标准测试视频序列,用恒定QP进行编码;通过改变QP值,获得对应的MOS分数值;该关系可以被描述为一个倒S的曲线,在QP较小时MOS下降不大,之后MOS快速下降,而最后趋于平滑且取值接近;不同的视频形状各不相同;四组标准测试视频序列分别为足球,电影,工头,母女;即Football,Mobile,Foreman,mother_daugher;具有更高纹理丰富度即空间信息和运动剧烈度即时间信息的视频,Football,Mobile在相同QP条件下,具有相对较高的感知质量;相应地,Mother_daugher的运动剧烈度和纹理丰富度较低,在相同QP条件下感知质量较低;而Foreman具有中等的时间和空间复杂度,以及中等的感知分数;这种差异符合HVS的掩蔽效应,视频内容在影响感知质量中扮演重要角色;将视频内容特征的影响加入到视频质量评价中去;充分利用视频内容的两个主要特征因素:空间复杂度和时间复杂度;S2.空间复杂度H.264编解码主要分为5个部分:帧内和帧间预测Estimation,变换Transform和反变换,量化Quantization和反量化,环路滤波LoopFilter,熵编码;H.264采用了更多有效的帧内与帧间预测模式,对于帧内预测编码,H.264提供了9种模式的4×4预测模式,适用于带有大量细节的图像编码,以及4种16×16预测模式,适用于平坦区域的图像编码;对于帧间预测编码,H.264支持7种宏块分割模式,分别是16×16、16×8、8×8、8×4、4×8和4×4,每个分割块或者子宏块都有独立的运动补偿,大的分割尺寸对应平坦区域,小尺寸对应细节较多的区域;因此,小尺寸的预测模式可以反映纹理细节较多的区域;为此,定义帧间8×8、8×4、4×8、4×4以及帧内4×4为小尺寸预测模式SPM(SmallPredictionMode);所以小尺寸预测块的个数总和记为SPM_total,所有预测块的个数总和记为Prdmode_total;则小尺寸预测块占所有预测块总数的比例SPM_Ratio,就能说明视频序列包含的细节丰富程度;其值越大,证明视频纹理越丰富,即空间复杂度越高,感知质量越高,反之则越小;4×4块数据经过预测、变换、量化后的数据表现出如下特性:非零系数主要集中在低频部分,包括了图像的大部分内容;而高频系数大部分是零;因此,DCT系数很大程度上反映了视频纹理丰富度;为此,定义了I帧中平均每个4×4块包含的非零数比例,用来表示纹理的丰富程度;其中,Coeff_Token是所有4×4块非零个数的总和,Inum是I帧的数目,BLKnum是每帧4×4块数目,16是归一化的系数,即非零数最大值;AV...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。