一种基于AIGC大模型图像生成技术的少样本数据扩增方法技术

技术编号:43114974 阅读:28 留言:0更新日期:2024-10-26 09:53
本发明专利技术属于人工智能、计算机图形学和自然语言处理应用技术领域,具体公开一种基于AIGC大模型图像生成技术的少样本数据扩增方法,包括以下步骤,通过构建详尽的文生图数据集、训练专用的文生图大模型、生成三元文本指令、成对图像生成、文本引导图生图大模型训练以及现场图像编辑等步骤。本发明专利技术的一种基于AIGC大模型图像生成技术的少样本数据扩增方法的有益效果在于:实现对各种场景的高度逼真模拟,从而有效地扩充少样本数据集,同时不仅能够生成逼真的场景虚假图像,而且能够极大程度上扩充少样本数据集,有助于提高下游检测、识别、分割等小模型算法的鲁棒性和准确性,为相关领域的研究和应用提供了强有力的数据支持。

【技术实现步骤摘要】

本专利技术属于人工智能、计算机图形学和自然语言处理应用,具体公开了一种基于aigc大模型图像生成技术的少样本数据扩增方法。


技术介绍

1、在当前的技术背景下,少样本数据扩增在多个行业中发挥着至关重要的作用,尤其是在需要大量高质量图像数据的领域。然而这些领域面临着一个主要问题:缺乏足够的数据来训练和优化模型,由于目标对象的形态多变且受多种环境因素影响,获取高质量的图像数据既困难又成本高昂。此外,实际的模拟采集不仅耗费巨大,而且存在安全隐患,这些因素严重限制了算法的性能和应用范围。

2、为了解决上述问题,业界普遍采取的做法是利用现有的有限数据集进行模型训练,并通过数据增强技术来人工扩充数据集,这些方法虽然在一定程度上缓解了数据稀缺的问题,但仍然难以模拟真实世界中的全部复杂性。此外,数据增强可能导致图像失真,从而影响模型的泛化能力和识别准确性。

3、基于上述问题,本专利技术提供一种基于aigc大模型图像生成技术的少样本数据扩增方法。


技术实现思路

1、专利技术目的:本专利技术的目的是提供一种本文档来自技高网...

【技术保护点】

1.一种基于AIGC大模型图像生成技术的少样本数据扩增方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于AIGC大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,包括收集和整理不同环境条件下的图像I集合和对应的文本描述集合T;

3.根据权利要求2所述的一种基于AIGC大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,进一步包括对图像I进行预处理,以及对文本描述T进行语义分析和标注。

4.根据权利要求1或2或3所述的一种基于AIGC大模型图像生成技术的少样本数据扩增方...

【技术特征摘要】

1.一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,包括收集和整理不同环境条件下的图像i集合和对应的文本描述集合t;

3.根据权利要求2所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,进一步包括对图像i进行预处理,以及对文本描述t进行语义分析和标注。

4.根据权利要求1或2或3所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述文生图数据集,用于训练文生图大模型,以提高生成图像的真实性和多样性。

5.根据权利要求1所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤b)中文生图大模型的训练过程,包括但不限于模型架构的选择、损失函数loss的优化、学习率lr的调整和过拟合的防止,以确保生成图像的高质量和多样性。

6.根据权利要求1所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤b)中文生图大模型gtext2image,包括但不限于stable diffusion、stablediffusion xl,通过以下...

【专利技术属性】
技术研发人员:王龙王玉琛孙子正周超赵亚军王成军景文林
申请(专利权)人:南京南自信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1