基于大型视觉语言模型的异常检测方法及装置制造方法及图纸

技术编号:40744261 阅读:21 留言:0更新日期:2024-03-25 20:02
本发明专利技术提供一种基于大型视觉语言模型的异常检测方法及装置,涉及人工智能技术领域,该方法包括:将待检测工业图像输入至目标视觉语言模型中的目标图像编码模块,得到多尺度图像特征;将多尺度图像特征输入至目标视觉语言模型中的目标特征融合模块,得到融合特征;将融合特征和待检测工业图像对应的异常检测问题文本输入至目标视觉语言模型中的目标语言模块,得到异常检测答案文本;目标视觉语言模型是基于通过贝塞尔曲线生成算法生成的模拟样本图像、模拟样本图像对应的异常检测问题文本、图像描述文本、异常检测定位标签和异常检测答案标签训练得到的。本发明专利技术实现即使在异常样本稀缺的情况下,也可有效提高异常检测的效率和精准性。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种基于大型视觉语言模型的异常检测方法及装置


技术介绍

1、工业异常检测是在工业生产过程中识别和检测异常情况的技术。工业异常检测不仅可以提高生产效率和产品质量,还可以降低生产成本、保障安全生产,因此如何高效精准地进行工业异常检测对工业生产亟待解决的技术问题。

2、在工业异常检测中,需要充足的样本才能够检测和定位工业产品图像中的异常区域。然而,由于工厂中异常样本通常稀缺且缺陷类型难以预测,进而难以精准高效地进行异常检测。

3、亟需一种基于大型视觉语言模型的异常检测方法及装置来解决上述技术问题。


技术实现思路

1、本专利技术提供一种基于大型视觉语言模型的异常检测方法及装置,用以解决现有技术中异常样本稀缺,难以精准高效地进行异常检测的缺陷,实现在异常样本稀缺的情况下,提高异常检测的效率和精准性。

2、本专利技术提供一种基于大型视觉语言模型的异常检测方法,包括:

3、将待检测工业图像输入至目标视觉语言模型中的目标图像编码模块,得到所述待本文档来自技高网...

【技术保护点】

1.一种基于大型视觉语言模型的异常检测方法,其特征在于,包括:

2.根据权利要求1所述的基于大型视觉语言模型的异常检测方法,其特征在于,所述目标视觉语言模型是基于如下步骤训练得到:

3.根据权利要求2所述的基于大型视觉语言模型的异常检测方法,其特征在于,所述初始视觉语言模型包括初始图像编码模块、初始图像解码模块、初始文本编码模块、初始特征提取模块、初始特征融合模块和初始语言模块;

4.根据权利要求3所述的基于大型视觉语言模型的异常检测方法,其特征在于,所述初始图像解码模块包括特征对齐层和异常定位层,所述特征对齐层包括特征金字塔层和第一特征融合层;...

【技术特征摘要】

1.一种基于大型视觉语言模型的异常检测方法,其特征在于,包括:

2.根据权利要求1所述的基于大型视觉语言模型的异常检测方法,其特征在于,所述目标视觉语言模型是基于如下步骤训练得到:

3.根据权利要求2所述的基于大型视觉语言模型的异常检测方法,其特征在于,所述初始视觉语言模型包括初始图像编码模块、初始图像解码模块、初始文本编码模块、初始特征提取模块、初始特征融合模块和初始语言模块;

4.根据权利要求3所述的基于大型视觉语言模型的异常检测方法,其特征在于,所述初始图像解码模块包括特征对齐层和异常定位层,所述特征对齐层包括特征金字塔层和第一特征融合层;

5.根据权利要求3所述的基于大型视觉语言模型的异常检测方法,其特征在于,所述初始特征融合模块包括第二特征融合层和自注意力层;

6.根据权利要求2-5任一项所述的基于...

【专利技术属性】
技术研发人员:袁烨张永兰儒恺周晨金骏阳王茂霖
申请(专利权)人:元始智能科技南通有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1