一种基于大模型的目标检测数据扩增方法及系统技术方案

技术编号:43914911 阅读:22 留言:0更新日期:2025-01-03 13:21
本申请公开了一种基于大模型的目标检测数据扩增方法及系统,涉及目标检测、人工智能技术,包括:利用场景图集训练基础文生图大模型,获得场景图生成大模型,并生成场景图;利用语义分割模型对场景图进行分割,以获得用于目标生成的局部区域;利用目标图集训练基础文生图大模型,获得目标图生成大模型;在场景图的局部区域利用目标图生成大模型进行目标生成,以获得添加目标的图像;对场景图和添加目标的图像进行差异区域计算,以确定目标标注数据;根据目标标注数据以及相应添加目标的图像,确定扩增后的目标检测数据集。本申请的方法用于解决目前数据扩增中在数据多样性和信息保留方面存在的技术问题,显著提升目标检测模型的性能和应用范围。

【技术实现步骤摘要】

本申请涉及目标检测、人工智能,尤其涉及一种基于大模型的目标检测数据扩增方法及系统


技术介绍

1、在目标检测任务中,数据扩增是提高模型性能至关重要的一环。当训练样本数量有限时,模型往往面临过拟合的风险,无法泛化到新的数据集或场景中。数据扩增通过增加训练集的多样性,可以有效提升模型的鲁棒性和准确率。

2、当前数据扩增方法包括传统的图像变换方法如裁剪、镜像、旋转等,以及基于生成对抗网络(generative adversarial network,gan)的数据扩增方法。这些方法在一定程度上可以增加数据集的多样性,但也存在一些明显的缺点。传统图像变换方法可能会导致信息丢失或增加噪音,特别是在目标检测任务中,可能会影响到目标的识别精度和位置精度。而基于gan的方法虽然能够生成逼真的图像,但在实际应用中生成的图像质量难以控制,并且生成的图像与真实目标场景存在差异,导致模型在真实场景中的表现不佳。

3、在目标检测领域,数据扩增技术的应用对模型的性能至关重要。当训练数据不足时,数据扩增可以通过增加数据集的多样性来改善模型的泛化能力和鲁棒性。传统本文档来自技高网...

【技术保护点】

1.一种基于大模型的目标检测数据扩增方法,其特征在于,包括:

2.如权利要求1所述的基于大模型的目标检测数据扩增方法,其特征在于,所述基础文生图大模型包括文本编码器、图像信息生成器和图像信息解码器;

3.如权利要求2所述的基于大模型的目标检测数据扩增方法,其特征在于,合并初始场景图集和生成的场景图得到场景图集,利用语义分割模型对场景图进行分割,以获得用于目标生成的局部区域包括:

4.如权利要求2所述的基于大模型的目标检测数据扩增方法,其特征在于,利用目标图集和场景图中的局部区域图像信息,训练基础文生图大模型,以获得目标图生成大模型包括:

5...

【技术特征摘要】

1.一种基于大模型的目标检测数据扩增方法,其特征在于,包括:

2.如权利要求1所述的基于大模型的目标检测数据扩增方法,其特征在于,所述基础文生图大模型包括文本编码器、图像信息生成器和图像信息解码器;

3.如权利要求2所述的基于大模型的目标检测数据扩增方法,其特征在于,合并初始场景图集和生成的场景图得到场景图集,利用语义分割模型对场景图进行分割,以获得用于目标生成的局部区域包括:

4.如权利要求2所述的基于大模型的目标检测数据扩增方法,其特征在于,利用目标图集和场景图中的局部区域图像信息,训练基础文生图大模型,以获得目标图生成大模型包括:

5.如权利要求2所述的基于大模型的目标检测数据扩增...

【专利技术属性】
技术研发人员:石晓军张伟张尚斌杜光勋孙家腾
申请(专利权)人:中国电子科技集团公司信息科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1