一种面向视频传输质量的深度学习图像评价方法技术

技术编号：22298684 阅读：74 留言：0更新日期：2019-10-15 07:15

本发明专利技术公开了一种面向视频传输质量的深度学习图像评价方法，该方法包括：构造用于评价图像质量的孪生神经网络来提取特征，并对于目标图像块特征图、参考图像块特征图进行特征融合，设计出图像质量评价分数计算方法与损失函数来更新网络参数；设置孪生神经网络训练超参数，包括学习率、学习衰减率、最大训练步数、学习率衰减步数、批训练量、训练图像尺寸、单张图像采样量、数据集(训练集、验证集、测试集)分配等；设计出目标图像与参考图像的图像区域分割与块选择方案。

A Deep Learning Image Evaluation Method for Video Transmission Quality

全部详细技术资料下载

【技术实现步骤摘要】
一种面向视频传输质量的深度学习图像评价方法
本专利技术涉及图像质量评价领域，尤其涉及一种基于深度学习的图像质量评价方法。
技术介绍
视频图像在传输过程中会因种种原因对最后的传输质量产生较大影响，所以对于图像传输质量的正确评价就显得很重要。现有的图像质量评价技术很多都是依赖人类视觉系统或自然图像统计的计算模型，甚至是人工评价。前者评价分数与人眼主观平均意见分数相关度有时相对较低，容易出现判断不一致的情况；而后者则效率很低，长时间工作容易出现疲劳误差，影响判断准确性，为此寻找一种能高效、准确、智能地评价视频图像传输质量的方法具有重要现实意义。
技术实现思路
为解决上述技术问题，本专利技术的目的是提供一种面向视频传输质量的深度学习图像评价方法。本专利技术的目的通过以下的技术方案来实现：一种面向视频传输质量的深度学习图像评价方法，包括：A构造一对用于评价图像质量的结构相同、权重共享的孪生神经网络，孪生神经网络两端输入尺寸分别为X×Y×3的目标图像块和参考图像块，输出特征图像，对特征图像进行特征融合，回归得到评价分数，根据损失函数及数据标签与评价分数，更新网络参数；B设置孪生神经网络训练超参数，包括学习率Learning_Rate、学习衰减率Decay_Rate、最大训练步数Max_Steps、学习率衰减步数Decay_Step、批训练量Batch_Size、训练图像尺寸M×N×3、单张图像采样量Sample_num、与数据集的设置；所述数据集包括训练集、验证集与测试集；C目标图像与参考图像分割成m×n块尺寸符合孪生神经网络输入的目标图像块与参考图像块，并按照横向每km...

【技术保护点】
1.一种面向视频传输质量的深度学习图像评价方法，其特征在于，所述方法包括：A构造一对用于评价图像质量的结构相同、权重共享的孪生神经网络，孪生神经网络两端输入尺寸分别为X×Y×3的目标图像块和参考图像块，输出特征图像，对特征图像进行特征融合，回归得到评价分数，根据损失函数及数据标签与评价分数，更新网络参数；B设置孪生神经网络训练超参数，包括学习率Learning_Rate、学习衰减率Decay_Rate、最大训练步数Max_Steps、学习率衰减步数Decay_Step、批训练量Batch_Size、训练图像尺寸M×N×3、单张图像采样量Sample_num、与数据集的设置；所述数据集包括训练集、验证集与测试集；C目标图像与参考图像分割成m×n块尺寸符合孪生神经网络输入的目标图像块与参考图像块，并按照横向每km个图像块取1个、纵向每kn个图像块取1个的方式对目标图像与参考图像降采样；D完成神经网络训练，得到训练模型，实际部署后即可实时评价视频流输入的目标图像质量。

【技术特征摘要】
1.一种面向视频传输质量的深度学习图像评价方法，其特征在于，所述方法包括：A构造一对用于评价图像质量的结构相同、权重共享的孪生神经网络，孪生神经网络两端输入尺寸分别为X×Y×3的目标图像块和参考图像块，输出特征图像，对特征图像进行特征融合，回归得到评价分数，根据损失函数及数据标签与评价分数，更新网络参数；B设置孪生神经网络训练超参数，包括学习率Learning_Rate、学习衰减率Decay_Rate、最大训练步数Max_Steps、学习率衰减步数Decay_Step、批训练量Batch_Size、训练图像尺寸M×N×3、单张图像采样量Sample_num、与数据集的设置；所述数据集包括训练集、验证集与测试集；C目标图像与参考图像分割成m×n块尺寸符合孪生神经网络输入的目标图像块与参考图像块，并按照横向每km个图像块取1个、纵向每kn个图像块取1个的方式对目标图像与参考图像降采样；D完成神经网络训练，得到训练模型，实际部署后即可实时评价视频流输入的目标图像质量。2.如权利要求1所述的面向视频传输质量的深度学习图像评价方法，其特征在于，所述步骤A中，目标图像块与参考图像块尺寸分别为64×64×3；所述孪生神经网络由卷积层、池化层、特征融合、全连接层组成；所述卷积层采用激活函数为ReLu函数，卷积核大小均为3×3；所述池化层采用最大池化，池化核大小为2×2，步长为2×2；所述全连接层包含两层，第一层输入为大小3×512×Sample_num，输出大小为512×Sample_num；第二层输入大小为512×Sample_num，输出大小为Sample_num。3.如权利要求2所述的面向视频传输质量的深度学习图像评价方法，其特征在于，所述卷积层中每次卷积前对特征图像进行边界填充，第1个卷积层输出16张特征图像，每2次卷积输出特征图像进行1次池化、下次卷积输出数量乘2，总共进行12次卷积操作；所述池化层中假设参考图像池化后特征图像为Ireference、目标图像池化后特征图像为Itarget，两者尺寸为1×1×512×Sample_num，将Ireference-Itarget得Idifferen...

【专利技术属性】
技术研发人员：刘桂雄，蒋晨杰，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人