当前位置: 首页 > 专利查询>福州大学专利>正文

融合局部和全局特征的无参考图像质量评价方法及系统技术方案

技术编号:34131477 阅读:38 留言:0更新日期:2022-07-14 15:32
本发明专利技术涉及一种融合局部和全局特征的无参考图像质量评价方法及系统,该方法包括以下步骤:步骤S1:对失真图像数据集中的图像进行数据预处理,并将数据集划分为训练集与测试集;步骤S2:构建全局及局部图像坐标提取模块;步骤S3:构建时间注意力机制模块;步骤S4:构建融合局部和全局图像特征的无参考图像质量评价网络,并采用训练集训练所述无参考图像质量评价网络;步骤S5:将测试集中图像输入到训练好的无参考图像质量评价网络模型中,输出对应的图像质量评价结果。该方法及系统有利于提高无参考图像质量评价的准确性。无参考图像质量评价的准确性。无参考图像质量评价的准确性。

【技术实现步骤摘要】
融合局部和全局特征的无参考图像质量评价方法及系统


[0001]本专利技术属于图像处理以及计算机视觉领域,具体涉及一种融合局部和全局特征的无参考图像质量评价方法及系统。

技术介绍

[0002]随着移动时代的到来,每天都有数十亿张图片在各种社交媒体应用中产生,其中大部分是由非专业用户在各种室外环境中拍摄的。与专业摄影师拍摄的图片不同,普通用户所拍摄的图片的质量往往会因为曝光不足或过度、低能见度、运动模糊、重影等失真而下降。并且由于技术或硬件局限性等原因,图像中不可避免引入各种不同程度的失真,呈现出不同程度的质量下降,在压缩、处理、传输、显示等过程中也难免会出现一定程度的失真。而高质量的图像一方面可以提高观看者的体验质量,另一方面可以使许多计算机视觉算法受益。因此如何衡量图像的质量、评定图像是否满足某种特定应用要求就是图像质量评价的目标。而且图像质量评估结果可作为一些图像恢复增强技术的辅助参照信息,因此图像质量评价方法是非常需要的,它们也可为设计和优化高级图像/视频处理算法提供一种可行的途径。
[0003]传统的无参考图像质量评价方法依赖于人本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融合局部和全局特征的无参考图像质量评价方法,其特征在于,包括以下步骤:步骤S1:将失真图像数据集划分为训练集与测试集,并对数据集中图像进行数据预处理;步骤S2:构建全局及局部图像坐标提取模块;步骤S3:构建时间注意力机制模块;步骤S4:构建融合局部和全局图像特征的无参考图像质量评价网络,并采用训练集训练所述无参考图像质量评价网络;步骤S5:将测试集中图像输入到训练好的无参考图像质量评价网络模型中,输出对应的图像质量评价结果。2.根据权利要求1所述的融合局部和全局特征的无参考图像质量评价方法,其特征在于,所述步骤S1具体包括以下步骤:步骤S11:将失真图像数据集中的图像与其对应的标签进行配对处理;步骤S12:将失真图像数据集中的图像按设定比例划分为训练集与测试集;步骤S13:将训练集中所有待训练图像缩放到固定尺寸H
×
W;步骤S14:对步骤S13处理后的图像进行统一的随机翻转操作,对数据进行增强;步骤S15:对步骤S14处理后的图像和测试集中的图像进行归一化处理。3.根据权利要求1所述的融合局部和全局特征的无参考图像质量评价方法,其特征在于,所述步骤S2中,所述全局及局部图像坐标提取模块按如下方法执行取全局或局部图像坐标操作:将尺寸为H
×
W的图像划分为n2个不相交的全局或局部图像,全局或局部图像的尺寸为h
×
w,其中然后记录每一个全局或局部图像左上角和右下角像素在原始图像的坐标,其中n为设定参数,当n=1时提取的是全局图像,n>1时提取的是局部图像;所述全局及局部图像坐标提取模块重复执行上述取全局或局部图像坐标操作N次,第i次执行时参数n=i,得到N个图像尺度上的全局或局部图像的左上角和右下角的坐标,将各图像尺度上的全局或局部图像的左上角和右下角的坐标进行拼接,得到左上角和右下角的坐标向量(x
l
,y
l
,x
r
,y
r
),向量的维度为Q,其中,Q=1+22+32+

+N2。4.根据权利要求3所述的融合局部和全局特征的无参考图像质量评价方法,其特征在于,所述步骤S3具体包括以下步骤:步骤S31:设时间注意力机制模块的输入为F
in
,其维度为C
×
h
x
×
w
x
;首先改变输入特征F
in
,维度为Q
×
c
×
h
x
×
w
x
,得到特征F
reshape
,其中,c=C/Q,Q为局部和全局图像个数;步骤S32:将步骤S31中的F
reshape
依次输入空间池化层和通道池化层,首先将F
reshape
输入到空间池化层,得到输出F
spatial
,其维度为Q
×
c
×1×
1,F
spatial
的计算公式为:F
spatial
=Maxpool(F
reshape
)+Avgpool(F
reshape
)其中,Maxpool(*)表示步长为1的空间最大池化层,Avgpool(*)表示步长为1的空间平均池化层;然后将F
spatial
输入到通道池化层,得到输出F
channel
,其维度为Q
×1×1×
1,F
channel
的计算公式为:F
channel
=Conv1×1(Concat(CMaxpool(F
spatial
),CAvgpool(F
spatial
)))
其中,CMaxpool(*)表示步长为1的通道最大池化层,CAvgpool(*)表示步长为1的通道平均池化层,Concat(
·
)表示特征在新的维度上进行拼接,Conv1×1(*)表示用于降维且卷积核大小为1
×
1的卷积层;步骤S33:将步骤S32中的F
channel
通过Reshape操作改变其维度,由Q
×1×1×
1变为Q,然后将F
channel
输入两层全连接层中,采用注意力机...

【专利技术属性】
技术研发人员:牛玉贞赖宇
申请(专利权)人:福州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1