当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于扩散模型的数据和标签的生成方法及相关装置制造方法及图纸

技术编号:43442912 阅读:18 留言:0更新日期:2024-11-27 12:48
本发明专利技术公开了一种基于扩散模型的数据和标签的生成方法及相关装置,属于计算机视觉领域,所述方法包括:获取高质量多样化图像;采用无监督实例分割模型识别高质量多样化图像生成图像标签;通过高质量多样化图像的掩码中裁剪得到裁剪图像,提取高质量多样化图像和裁剪图像的特征并判断特征之间的余弦相似度是否满足保留条件,若余弦相似度满足保留条件,则保留对应图像标签,若余弦相似度不满足保留条件,则删除对应图像标签,从而得到高质量图像标签;将高质量多样化图像与多种背景合并,并结合高质量图像标签,生成具有复杂背景的综合训练数据集,实现基于扩散模型的数据和标签的生成。本发明专利技术解决现有技术难以生成高质量多样化的合成图像的问题。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,具体涉及一种基于扩散模型的数据和标签的生成方法及相关装置


技术介绍

1、现有的深度视觉模型严重依赖于大量的高质量数据,通常需要大量的数据和精确的注释来取得显著进展。然而,在像素或边界框级别手动标注大规模训练图像是一项极其劳动密集的任务,并且对人类提供一致的标记质量提出了巨大挑战。近年来,随着半监督标注技术和视觉任务弱监督学习技术的发展,在减轻图像标注的人工负担方面取得了一些进展。半监督方法旨在通过利用有限的带注释图像集和大量未标记图像池来提高模型性能。然而,这些技术仍然依赖于带注释的图像,并且要求标记和未标记的数据集共享相似的域分布。

2、目前,在人工智能生成内容提供了一种有吸引力的解决方案,可以减少视觉模型训练对手动注释数据的依赖。某些研究中利用生成对抗网络生成用于对象检测或语义分割的训练数据集,从而最大限度地减少了对手动注释的需求。然而,基于生成对抗网络的方法通常难以生成多样化的图像,这可能会限制训练模型的泛化能力。此外,文本到图像扩散模型的出现提供了一种有希望的替代方案,能够从详细的文本描述中生成高度逼真的本文档来自技高网...

【技术保护点】

1.一种基于扩散模型的数据和标签的生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述根据所述目标主题文本并采用大型语言模型得到详细文本描述数据的步骤,具体包括:

3.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,采用深度卷积神经网络模型提取所述高质量多样化图像和裁剪图像的特征。

4.根据权利要求3所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述深度卷积神经网络模型采用VGG16模型。

5.根据权利要求1所述的一种基于扩散模型的数据和标...

【技术特征摘要】

1.一种基于扩散模型的数据和标签的生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述根据所述目标主题文本并采用大型语言模型得到详细文本描述数据的步骤,具体包括:

3.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,采用深度卷积神经网络模型提取所述高质量多样化图像和裁剪图像的特征。

4.根据权利要求3所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述深度卷积神经网络模型采用vgg16模型。

5.根据权利要求1所述的一种基于扩散模型的数据和标签的生成方法,其特征在于,所述高质量多样化图像的特征和所述裁剪图像的特征之间的余弦相似度通过下式得到:

6.根据权利要求1所述的一种基于扩...

【专利技术属性】
技术研发人员:李朋阳张翔赵万青罗迒哉胡琦瑶钟升
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1