基于3D-DCT域统计分析的无参考视频质量评价方法技术

技术编号：13798704 阅读：113 留言：0更新日期：2016-10-06 23:35

本发明专利技术公开了一种基于3D-DCT域统计分析的无参考视频质量评价方法，主要解决现有方法中应用失真类型有限，对视频的空-时信息利用不足的局限。其实现步骤是：(1)对数据集所有视频进行局部3D-DCT计算；(2)根据3D-DCT系数，提取反映不同统计特性的特征；(3)对特征进行合并得视频总体特征；(4)将数据集分为训练集和测试集，训练集用于训练特征到真实质量分数之间的回归映射模型，再将学习到的回归模型预测测试视频的质量分数。统计预测结果与真实分数之间相关性，作为质量评价的性能指标。本发明专利技术与现有方法相比，不需要额外的运动估计，仅需对3D-DCT域统计分析，实现了同时捕获视频的空-时统计特性，提高了客观质量预测与主观评价的一致性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像/视频处理
，特别涉及视频质量评价方法，可用于多媒体信息处理、影视创作等领域。
技术介绍
随着多媒体与网络传输技术的快速发展，海量的视频信号在用户端和视频服务商间产生、传输、存储和显示，并用于不同的应用中，如网络电视、视频监控、视频会议等。然而由于压缩损失、传输信道带宽等因素的限制，原始的视频会不可避免的引入一些失真或丢失部分信息，造成视频质量的下降。为了将用户端视频质量维持在可接受的范围内，提高用户的体验质量，设计准确的视频质量评价算法是非常必要且重要的。客观的质量评价方法目的在于在无人类观察者参与的情况下自动评价视频的视觉质量。根据评价过程中有无参考视频参与，可将客观评价方法分为三类：有参考、半参考和无参考。其中无参考视频质量评价是应用最为广泛、最具挑战的一类工作，也是本专利技术要探索的问题。目前无参考视频质量评价方法面临的挑战主要有以下三点。1)参考视频信息的缺失使得无法从相似度或保真度的角度定义质量；2)视频的时空复杂度高。难以提取质量相关的反映视频时空特性的特征；3)对人类视觉系统理解有限，提取特征与主观视觉质量之间的映射关系难以建模。目前，无参考的视频质量评价方法主要分为两类：一是针对特定视频类型的评价方法。这种方法是研究特定失真如压缩、传输误差失真等的特性以及其与视频视觉质量的映射关系，从而对这类失真视频质量进行评价。如Zhang等人在文献“F.Zhang,W.Lin,Z.Chen,and K.N.Ngan.Additive log-logistic model for networked video quality...

【技术保护点】
一种基于3D‑DCT域统计分析的无参考视频质量评价方法，其特征在于，包括以下步骤：1)对视频质量评估数据库中的每个视频进行3D‑DCT计算，获取反映视频时空频域信息的一维向量形式的交流系数；2)利用步骤1)一维向量形式的交流系数，提取每个视频中每M×N个时空立方体的时空统计特征；所述视频中每M×N个时空立方体的时空统计特征包括基本谱特征、能量波动特征、形状参量特征以及分布变化特征；2.1)提取视频3D‑DCT域的基本谱特征；2.1.1)利用无符号交流系数的均值和方差度量之比获得K个交流频率的基本谱特征，所述无符号交流系数为交流系数的绝对值；2.1.2)将所有K个交流频率的基本谱特征连接一起构成特征f1＝[s1,s2…,sK]T；2.2)提取描述视频3D‑DCT域能量波动特征；所述视频3D‑DCT域能量波动特性包括平均谱能量和熵度量；2.2.1)计算平均谱能量和熵度量，具体计算公式分别为：rk=1NMΣm=1m-MΣn=1n-Nlog2[Ck(m,n)]2,]]>ek=-Σi=1i=Nbpi(|Ck|)log2(pi(|Ck|)),]]>其中，rk为第...

【技术特征摘要】
1.一种基于3D-DCT域统计分析的无参考视频质量评价方法，其特征在于，包括以下步骤：1)对视频质量评估数据库中的每个视频进行3D-DCT计算，获取反映视频时空频域信息的一维向量形式的交流系数；2)利用步骤1)一维向量形式的交流系数，提取每个视频中每M×N个时空立方体的时空统计特征；所述视频中每M×N个时空立方体的时空统计特征包括基本谱特征、能量波动特征、形状参量特征以及分布变化特征；2.1)提取视频3D-DCT域的基本谱特征；2.1.1)利用无符号交流系数的均值和方差度量之比获得K个交流频率的基本谱特征，所述无符号交流系数为交流系数的绝对值；2.1.2)将所有K个交流频率的基本谱特征连接一起构成特征f1＝[s1,s2…,sK]T；2.2)提取描述视频3D-DCT域能量波动特征；所述视频3D-DCT域能量波动特性包括平均谱能量和熵度量；2.2.1)计算平均谱能量和熵度量，具体计算公式分别为： r k = 1 NM Σ m = 1 m - M Σ n = 1 n - N log 2 [ C k ( m , n ) ] 2 , ]]> e k = - Σ i = 1 i = N b p i ( | C k | ) log 2 ( p i ( | C k | ) ) , ]]>其中，rk为第k个交流频率上的平均谱能量，ek为第k个交流频率上的熵度量，pi(|Ck|)为第k个交流频率上无符号交流系数落在第i箱内
\t的概率，Nb为总的箱数；2.2.2)将所有K个交流频率对应的平均谱能量和熵度量分别连接一起构成特征f2＝[r1,r2…,rK]T和f3＝[e1,e2…,eK]T；2.3)提取描述视频3D-DCT域形状参量特征；2.3.1)统计各交流频率上交流系数的概率分布，并利用广义高斯分布对每个交流频率上交流系数的概率分布进行拟合，获取每个交流频率上分布的形状参量；2.3.2)将所有K个交流频率上分布的形状参量连接一起构成对应的特征f4＝[γ1,γ2…,γK]T；2.4)提取视频3D-DCT域分布变化特征；2.4.1)计算每个交流频率上交流系数分布与所有K个交流频率上交流系数的平均分布之间的city-block距离从而度量两者之间的距离，计算公式如下： d k = Σ i = 1 i = N b | p i ( | ...

【专利技术属性】
技术研发人员：李学龙，卢孝强，郭群，
申请(专利权)人：中国科学院西安光学精密机械研究所，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人