基于SAM模型的图像标注方法、装置及相关介质制造方法及图纸

技术编号:38997543 阅读:69 留言:0更新日期:2023-10-07 10:28
本发明专利技术公开了基于SAM模型的图像标注方法、装置及相关介质,该方法包括:获取训练数据集,并对训练数据集中的训练数据添加噪声;将训练数据输入至PVT网络中进行特征训练,以构建纠偏网络;获取待检测的目标数据,并利用纠偏网络对所述目标数据预测标注偏差并纠正;将纠正后的目标数据输入至SAM模型中,并由SAM模型预测输出所述目标数据的分割掩膜,然后将分割掩膜作为图像标注结果输出。本发明专利技术仅需要在标注过程中大致定位物体的位置,便可以根据纠偏网络预测出物体的精确位置,如此可以节省在标注过程中的精调时间开销,从而提升标注效率,同时将已纠偏的矩形框作为提示,通过SAM模型对物体的掩模进行预测,可以进一步提升标注效率和速度。效率和速度。效率和速度。

【技术实现步骤摘要】
基于SAM模型的图像标注方法、装置及相关介质


[0001]本专利技术涉及图像处理
,特别涉及基于SAM模型的图像标注方法、装置及相关介质。

技术介绍

[0002]目前基于目标检测以及实例分割算法已广泛应用于自动驾驶、安防等领域,该类视觉算法的应用依赖大量的人工数据标注,特别是对于特定领域的低频目标物体,例如打包垃圾、建筑垃圾等特定行业物体,现有的预训练模型无法达到减少标注成本的效果。
[0003]此外,在标注工作实践中,对于目标检测任务,由于标注精度的要求,标注人员需要投入大量时间来对所有矩形框进行微调调整,而这一步骤往往需要使用鼠标对图像进行缩放、位置调整等操作,导致标注效率低。并且对于实例分割标注来说,高精度地标注一个实例往往需要几分钟的时间,导致标注成本高且标注效率低,从而算法工程师在算法开发中会受到很多限制。因此,如何提高图像标注的精度和效率是本领域技术人员需要解决的问题。

技术实现思路

[0004]本专利技术实施例提供了一种基于SAM模型的图像标注方法、装置、计算机设备及存储介质,旨在提高对于图像数据标注本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于SAM模型的图像标注方法,其特征在于,包括:获取训练数据集,并对所述训练数据集中的训练数据添加噪声;其中,所述训练数据均带有标注的矩形框;将所述训练数据输入至PVT网络中进行特征训练,以构建纠偏网络;获取待检测的目标数据,并利用所述纠偏网络对所述目标数据预测标注偏差并纠正;将纠正后的目标数据输入至SAM模型中,并由所述SAM模型预测输出所述目标数据的分割掩膜,然后将分割掩膜作为图像标注结果输出。2.根据权利要求1所述的基于SAM模型的图像标注方法,其特征在于,所述获取训练数据集,并对所述训练数据集中的训练数据添加噪声;其中,所述训练数据均带有标注的矩形框,包括:按照[x1,y1,x2,y2]的形式对每一所述训练数据的矩形框进行表示;其中,x1、y1分别表示矩形框左上方的横坐标和纵坐标,x2、y2分别表示矩形框右下方的横坐标和纵坐标;按照下式,对所述训练数据的矩形框的位置信息添加随机噪声:Y

=Y+N其中,Y

表示添加噪声后的位置信息,Y表示位置信息,N表示高斯噪声,N
i
∈R4,i表示矩形框的索引;采用不同量化参数对所述训练数据进行JPEG压缩,以对所述训练数据进行图像扩增。3.根据权利要求1所述的基于SAM模型的图像标注方法,其特征在于,所述将所述训练数据输入至PVT网络中进行特征训练,以构建纠偏网络,包括:利用局部注意力机制对所述训练数据提取边界细节特征,并输出对应的第一特征图;通过嵌入层对所述第一特征图进行下采样处理,并增加通道数;将所述嵌入层的输出结果输入至编码层进行特征编码,得到第二特征图;利用全连接层对所述第二特征图进行偏移量预测输出,以构建所述纠偏网络。4.根据权利要求3所述的基于SAM模型的图像标注方法,其特征在于,还包括:按照下式,利用第一损失函数对所述纠偏网络进行参数更新:;其中,F表示矩阵范数,m表示计算损失函数时的批量大小,n
i
表示噪声的真实值,表示纠偏网络经过参数学习后的估计噪声。5.根据权利要求1所述的基于SAM模型的图像标注方法,其特征在于,所...

【专利技术属性】
技术研发人员:周长源韩咏烜
申请(专利权)人:深圳市万物云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1