一种基于大模型引导的图像分割方法技术

技术编号:41974593 阅读:42 留言:0更新日期:2024-07-10 16:53
本发明专利技术公开了一种基于大模型引导的图像分割方法,属于图像处理与计算机视觉技术领域,该方法包括:构建大模型引导分割网络模型;其中,大模型引导分割网络模型包括大模型优化模块和多任务图像处理模块;大模型优化模块用于对输入图像进行分割与过滤,得到接近真实场景标签的分割掩码,作为引导信息;多任务图像处理模块用于提取输入图像的特征图,并融合所述引导信息,实现图像分割;采用预设类型的图像集对构建的大模型引导分割网络模型进行训练;利用训练好的大模型引导分割网络模型得到待分割图像的图像分割结果。采用本发明专利技术的方案,可使模型能够利用大模型的良好分割结果进行引导;同时减少模型对数据标签的依赖,从而增强模型的泛化性能。

【技术实现步骤摘要】

本专利技术涉及图像处理与计算机视觉,特别是指一种基于大模型引导的图像分割方法


技术介绍

1、如今,智能驾驶技术已经成为现代交通系统中的一个重要组成部分。智能驾驶系统利用传感器和计算机视觉技术来实现车辆的自主导航和环境感知。其中,语义分割是智能驾驶视觉系统中的核心技术,它能够实现计算机视觉系统对物体和环境的精准理解和感知。

2、语义分割是人工智能的计算机视觉领域中的重要分支,其目标是让计算机能够从图像中提取有意义的信息。具体来说,语义分割将图像中的每个像素分为不同的类别,从而能够从图像中分割出物体、背景的轮廓与其对应的类别,用于理解图像中的物体和场景。语义分割的发展已经在医疗诊断、自动驾驶、安全监控、工业自动化等多个领域带来了革命性的影响。语义分割算法的可靠性为机器视觉系统提供决策依据,从而直接关系到算法应用的安全性和可靠性。

3、传统的语义分割方法仍然面临挑战,比如复杂场景的分割准确性低、算法的鲁棒性差等方面。具体地,目前现有的基于深度学习的图像分割方法大部分基于传统的卷积网络结构,无法获取图像的深层次特征,从而无法取得较高精度的本文档来自技高网...

【技术保护点】

1.一种基于大模型引导的图像分割方法,其特征在于,包括:

2.如权利要求1所述的基于大模型引导的图像分割方法,其特征在于,所述构建大模型引导分割网络模型,包括:

3.如权利要求2所述的基于大模型引导的图像分割方法,其特征在于,所述预设大模型为专门用于执行分割任务的SAM模型。

4.如权利要求2所述的基于大模型引导的图像分割方法,其特征在于,所述大模型全景分割器在输出初步分割掩码前,还按照输入图像尺寸1/20的比例过滤小的掩码;其中,所述小的掩码指的是小于预设尺寸的掩码。

5.如权利要求2所述的基于大模型引导的图像分割方法,其特征在于,所述主...

【技术特征摘要】

1.一种基于大模型引导的图像分割方法,其特征在于,包括:

2.如权利要求1所述的基于大模型引导的图像分割方法,其特征在于,所述构建大模型引导分割网络模型,包括:

3.如权利要求2所述的基于大模型引导的图像分割方法,其特征在于,所述预设大模型为专门用于执行分割任务的sam模型。

4.如权利要求2所述的基于大模型引导的图像分割方法,其特征在于,所述大模型全景分割器在输出初步分割掩码前,还按照输入图像尺寸1/20的比例过滤小的掩码;其中,所述小的掩码指的是小于预设尺寸的掩码。...

【专利技术属性】
技术研发人员:张利欣黄文腾刘子熠胡雨凡樊彬
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1