一种基于可学习提示的零样本异常图像检测方法技术

技术编号：39180228 阅读：19 留言：0更新日期：2023-10-27 08:28

本发明专利技术公开了一种基于可学习提示的零样本异常图像检测方法。设计了基于上下文优化的可学习提示生成模块，包含了参数可优化的可学习提示和图像异常状态提示；利用视觉语言大模型的图像编码网络获得多层级的待检图像视觉编码特征，同时利用文本编码网络获得可学习提示嵌入的文本特征。通过计算视觉编码特征和文本特征之间的多层级余弦相似度，构建图像异常区域计算模块，获得待检图像的异常区域。本发明专利技术提出的可学习提示避免了人工设计提示的复杂性和不稳定性，同时改善了图像异常检测的准确性，保证了零样本学习的有效性和高效性，极大降低了预训练视觉语言大模型迁移到下游任务的成本。务的成本。务的成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于可学习提示的零样本异常图像检测方法

[0001]本专利技术涉及计算机视觉和异常图像检测领域的一种图像异常检测方法，特别涉及一种基于可学习提示的零样本异常图像检测方法。

技术介绍

[0002]异常检测的主要任务是识别与常规模式不同的情形，广泛应用于视频监控、产品质量控制、医学诊断等领域。当前比较流行的异常检测方法大多利用无异常图像训练异常检测模型，进而定位图像的异常区域。然而这些方法为每一个特定物体类别构建相对应的异常检测模型，同时依赖大量的对应类别正常图像，无法满足包含大量物体类别的真实世界异常检测需求。基于提示工程的零样本学习为异常检测在真实世界中的应用打开了新的局面。
[0003]然而，提示工程的设计严重依赖领域专家经验，并且需要花费大量的时间来手工优化提示。
[0004]另外，手工设计提示中的个别文本改动都可能给检测性能带来巨大影响，具有较强的不稳定性。

技术实现思路

[0005]本专利技术的目的是为了解决
技术介绍
而提出的一种基于可学习提示的零样本异常图像检测方法，通过构建可学习提示增强提示工程的泛化能力，缓解人工设计提示对特定领域知识的依赖程度。另外，通过可学习提示与状态提示的有机组合，提升零样本异常检测的准确性，同时保证提示工程的稳定性和可靠性。
[0006]为了实现上述目的，本专利技术采用的技术方案为：
[0007]1)建立零样本的异常图像检测网络；
[0008]2)利用异常图像检测网络；
[0009]3)将待测图像输入到训练后的异常

【技术保护点】

【技术特征摘要】
1.一种基于可学习提示的零样本异常图像检测方法，其特征在于：1)建立异常图像检测网络；2)利用异常图像检测网络；3)将待测图像输入到训练后的异常图像检测网络获得异常区域热图，根据异常区域热图获得异常区域。2.根据权利要求1所述的一种基于可学习提示的零样本异常图像检测方法，其特征在于：所述的异常图像检测网络包括视觉编码网络、文本编码网络、多层感知机mlp、可学习提示生成模块和异常区域计算模块；视觉编码网络的输出经多个多层感知机mlp后输入到异常区域计算模块，同时通过可学习提示生成模块获得可学习提示嵌入，将可学习提示嵌入经文本编码网络处理后输入到异常区域计算模块，异常区域计算模块的输出依次经改变特征维度操作和元素相乘操作后获得异常区域热图的结果。3.根据权利要求1所述的一种基于可学习提示的零样本异常图像检测方法，其特征在于：所述的视觉编码网络包括依次进行的四个阶段，每个阶段均包含多层残差注意模块，每个阶段均输出视觉特征，四个阶段分别输出第一视觉特征T1、第二视觉特征T2、第三视觉特征T3和第四视觉特征T4作为视觉编码网络的输出。4.根据权利要求3所述的一种基于可学习提示的零样本异常图像检测方法，其特征在于：所述的视觉编码网络输出的四个视觉特征均经各自的多层感知机mlp处理后获得四个视觉编码特征，四个视觉编码特征共同输入到异常区域计算模块中。5.根据权利要求1所述的一种基于可学习提示的零样本异常图像检测方法，其特征在于：所述的可学习提示生成模块包括可学习提示和状态提示[state]；根据可学习提示和状态提示[state]按照以下公式获得可学习提示嵌入t，作为可学习提示生成模块的输出：t＝[V]1[V]2…
[V]
N
[state]所述的可学习提示中包含多个向量V
N
，每个向量的维度与状态提示[state]的维度相同，是通过随机初始化的方式获得；所述的状态提示[state]是对...

【专利技术属性】
技术研发人员：宋亚楠，沈卫明，
申请(专利权)人：浙江大学计算机创新技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人