【技术实现步骤摘要】
本专利技术属于计算机视觉领域,具体涉及一种基于扩散模型的数据和标签的生成方法及相关装置。
技术介绍
1、现有的深度视觉模型严重依赖于大量的高质量数据,通常需要大量的数据和精确的注释来取得显著进展。然而,在像素或边界框级别手动标注大规模训练图像是一项极其劳动密集的任务,并且对人类提供一致的标记质量提出了巨大挑战。近年来,随着半监督标注技术和视觉任务弱监督学习技术的发展,在减轻图像标注的人工负担方面取得了一些进展。半监督方法旨在通过利用有限的带注释图像集和大量未标记图像池来提高模型性能。然而,这些技术仍然依赖于带注释的图像,并且要求标记和未标记的数据集共享相似的域分布。
2、目前,在人工智能生成内容提供了一种有吸引力的解决方案,可以减少视觉模型训练对手动注释数据的依赖。某些研究中利用生成对抗网络生成用于对象检测或语义分割的训练数据集,从而最大限度地减少了对手动注释的需求。然而,基于生成对抗网络的方法通常难以生成多样化的图像,这可能会限制训练模型的泛化能力。此外,文本到图像扩散模型的出现提供了一种有希望的替代方案,能够从详细的文本
...【技术保护点】
1.一种基于扩散模型的数据和标签的生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述根据所述目标主题文本并采用大型语言模型得到详细文本描述数据的步骤,具体包括:
3.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,采用深度卷积神经网络模型提取所述高质量多样化图像和裁剪图像的特征。
4.根据权利要求3所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述深度卷积神经网络模型采用VGG16模型。
5.根据权利要求1所述的一种基
...【技术特征摘要】
1.一种基于扩散模型的数据和标签的生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述根据所述目标主题文本并采用大型语言模型得到详细文本描述数据的步骤,具体包括:
3.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,采用深度卷积神经网络模型提取所述高质量多样化图像和裁剪图像的特征。
4.根据权利要求3所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述深度卷积神经网络模型采用vgg16模型。
5.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述高质量多样化图像的特征和所述裁剪图像的特征之间的余弦相似度通过下式得到:
6.根据权利要求1所述的一种基于扩...
【专利技术属性】
技术研发人员:李朋阳,张翔,赵万青,罗迒哉,胡琦瑶,钟升,
申请(专利权)人:西北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。