【技术实现步骤摘要】
本专利技术属于人工智能、计算机图形学和自然语言处理应用,具体公开了一种基于aigc大模型图像生成技术的少样本数据扩增方法。
技术介绍
1、在当前的技术背景下,少样本数据扩增在多个行业中发挥着至关重要的作用,尤其是在需要大量高质量图像数据的领域。然而这些领域面临着一个主要问题:缺乏足够的数据来训练和优化模型,由于目标对象的形态多变且受多种环境因素影响,获取高质量的图像数据既困难又成本高昂。此外,实际的模拟采集不仅耗费巨大,而且存在安全隐患,这些因素严重限制了算法的性能和应用范围。
2、为了解决上述问题,业界普遍采取的做法是利用现有的有限数据集进行模型训练,并通过数据增强技术来人工扩充数据集,这些方法虽然在一定程度上缓解了数据稀缺的问题,但仍然难以模拟真实世界中的全部复杂性。此外,数据增强可能导致图像失真,从而影响模型的泛化能力和识别准确性。
3、基于上述问题,本专利技术提供一种基于aigc大模型图像生成技术的少样本数据扩增方法。
技术实现思路
1、专利技术目的:本专利
...【技术保护点】
1.一种基于AIGC大模型图像生成技术的少样本数据扩增方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于AIGC大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,包括收集和整理不同环境条件下的图像I集合和对应的文本描述集合T;
3.根据权利要求2所述的一种基于AIGC大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,进一步包括对图像I进行预处理,以及对文本描述T进行语义分析和标注。
4.根据权利要求1或2或3所述的一种基于AIGC大模型图像生成技
...【技术特征摘要】
1.一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,包括收集和整理不同环境条件下的图像i集合和对应的文本描述集合t;
3.根据权利要求2所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤a)中文生图数据集的构建,进一步包括对图像i进行预处理,以及对文本描述t进行语义分析和标注。
4.根据权利要求1或2或3所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述文生图数据集,用于训练文生图大模型,以提高生成图像的真实性和多样性。
5.根据权利要求1所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤b)中文生图大模型的训练过程,包括但不限于模型架构的选择、损失函数loss的优化、学习率lr的调整和过拟合的防止,以确保生成图像的高质量和多样性。
6.根据权利要求1所述的一种基于aigc大模型图像生成技术的少样本数据扩增方法,其特征在于:所述步骤b)中文生图大模型gtext2image,包括但不限于stable diffusion、stablediffusion xl,通过以下...
【专利技术属性】
技术研发人员:王龙,王玉琛,孙子正,周超,赵亚军,王成军,景文林,
申请(专利权)人:南京南自信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。