一种基于视觉语言模型的光场图像质量评价方法技术

技术编号：44432822 阅读：9 留言：0更新日期：2025-02-28 18:44

本发明专利技术提供了一种基于视觉语言模型的光场图像质量评价方法。该方法通过以下步骤实现对光场图像的多维度综合评价：(a)利用视觉语言模型的文本提示功能，以反义词提示配对对光场图像的清晰度、亮度及角度一致性等进行评估；(b)去除视觉语言模型图像编码器的固定位置嵌入，以提升模型对不同空间和角度分辨率光场图像的适应性；(c)使用上下文优化技术对反义词提示配对进行微调，适应光场图像的多视角特性，保持视觉语言模型的网络权重不变；(d)基于亮度、色彩和角度一致性等多维度评价指标对光场图像进行综合评价，并生成整体质量分数。本发明专利技术可用于高效编码、传输和渲染等光场图像处理场景，为光场图像质量评价提供了一种新的解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种用于光场图像质量评价的方法，尤其是基于视觉语言模型进行光场图像质量评估的方法，适用于评估光场图像的多维特性(如清晰度、亮度、角度一致性等)。

技术介绍

1、当前的图像质量评价方法主要应用于二维图像，主要关注图像的清晰度、色彩等指标。然而，光场图像具有独特的角度域特性，是由多视角的图像集合构成，因而在质量评价上比传统二维图像更加复杂。光场图像在虚拟现实、增强现实等领域中具有广泛的应用场景，其多视角特性使得在色彩一致性和角度一致性等维度上对图像质量有更高要求。然而，现有的图像质量评价方法在处理光场图像时存在局限性，难以充分考虑光场图像的清晰度、亮度、角度一致性等多维度特性，往往无法全面反映其实际质量。为此，本专利提出了一种基于视觉语言模型的光场图像质量评价方法。该方法利用视觉语言模型的多维度特征提示能力，无需专为光场图像设计复杂模型，即可直接对光场图像的质量进行综合评价，从而在保持模型适应性的同时，更全面地反映光场图像的质量。

技术实现思路

1、本专利技术提供了一种基于视觉语言模型(vlm)的光场图像质量评价方法，充分利用视觉语言模型中丰富的先验知识，对光场图像的质量进行多维度评价。该方法通过引入反义词提示配对策略和去除位置嵌入的优化手段，适用于具有角度域特性的光场图像，确保质量评估结果更加精确全面。

2、具体而言，本专利技术利用视觉语言模型的文本提示功能，设计了一系列反义词配对(如“清晰/模糊”、“明亮/黯淡”、“平滑/突兀”、“流畅/生硬”等)，这些提

3、针对光场图像的多视角特性，本专利技术对视觉语言模型的结构进行了优化，移除了原有的固定位置嵌入。这一改进使得模型能够灵活地处理不同尺寸和分辨率的光场图像输入，显著增强了模型的泛化能力与处理复杂光场图像的鲁棒性。

4、此外，本专利技术还提出了一种基于上下文优化技术(如coop等)的提示词微调方法。通过微调提示词以适应光场图像质量评价任务，本专利技术进一步提高了模型的评估准确性，保证了评价结果的可靠性。

5、在评估过程中，本专利技术从多维度对光场图像进行质量评估，最终得到一个综合的质量评分。这一过程确保了评估的全面性和客观性，为光场图像质量评价提供了有力支持。

6、本专利技术提供了一种基于视觉语言模型的光场图像质量评价方法，具备多维度、高准确性的优点，能够全面、准确地评估光场图像的质量。该方法为光场图像质量评价领域带来了重要的技术创新，具备广泛的应用前景和显著的实践价值。

本文档来自技高网...

【技术保护点】

1.一种基于视觉语言模型的光场图像质量评价方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的方法，其中的反义词提示配对包括但不限于使用“清晰/模糊”、“明亮/黯淡”等反义词对以及专门用来评价光场角度一致性的“平滑/突兀”、“流畅/生硬”等反义词对，从而更全面地反映光场图像的质量。

3.根据权利要求1所述的方法，其中的去除位置嵌入步骤，进一步包括去除或者替换视觉语言模型中的绝对位置编码，以提升模型在处理不同空间、角度分辨率光场图像的适应性和鲁棒性。

4.根据权利要求1所述的方法，其中的微调提示配对词步骤，进一步包括基于不同方法(如CoOp等)以及光场图像数据集(如DUT-LF等)训练视觉语言模型，以便在提示词调整过程中优化提示效果，从而提升模型在光场图像质量评价中的准确性。

5.根据权利要求1所述的方法，其中的光场图像质量评价步骤，进一步包括采用多维度的评价方法，包括但不限于清晰度、亮度、角度一致性等指标生成综合评价。

6.根据权利要求1-5任一项所述的光场图像质量评价方法，其中所述方法可应用于高效编码、传输

...

【技术特征摘要】

1.一种基于视觉语言模型的光场图像质量评价方法，其特征在于，该方法包括以下步骤：

4.根据权利要求1所述的方法，其...

【专利技术属性】
技术研发人员：陈晓明，钱宝童，余宗友，
申请(专利权)人：北京工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人