一种更偏向人们喜好的图像生成方法、装置、设备及介质制造方法及图纸

技术编号:41534256 阅读:17 留言:0更新日期:2024-06-03 23:11
本发明专利技术提供的一种更偏向人们喜好的图像生成方法、装置、设备及介质,涉及人工智能技术领域,通过将n个提示词依次输入随机选取的高性能图像生成算法中,每个提示词生成对应k个图像,并从图像中选出一张最符合人们喜好的图像,构成数据集A;将n个提示词分别输入大语言模型,获得的关键词组输入图像数据库进行搜索,选取热度最高的一张图以及随机选取相似度排名靠后的k‑1张图像,并将关键词与热图输入多模态模型获得新提示词,组成数据集B;将数据集A和数据集B输入CLIP进行微调学习,得到训练好的模型。本发明专利技术通过在训练集中明确区分首选图像和非首选图像来调整模型,使得模型更好地捕捉人类意图,生成的图像更符合人们的偏好。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体而言,涉及一种更偏向人们喜好的图像生成方法、装置、设备及介质


技术介绍

1、现有的ai图像深度生成模型可以根据人们的输入需求,短时间生成大量图片,但这些图片不太符合人们的喜好,导致用户需要再次精挑细选。

2、clip模型是一个多模态架构的文本图像预训练模型,它可以交叉理解图像和文本的关系。clip将提示词转换为与文本描述对应的高维空间向量表示,使得该向量能够捕捉到提示词所包含的语义信息。然而,目前的clip对人类意图无法精准表达,无法对同类型图片的偏好特征进行学习,也不能根据用户的行为更新人类的偏好,从而影响后续的图片生成效果,用户体验不佳。

3、有鉴于此,申请人在研究了现有的技术后特提出本申请。


技术实现思路

1、本专利技术旨在提供一种更偏向人们喜好的图像生成生成方法、装置、设备及介质,以解决现有方法中生成的图像与人们喜好不一致、不符合用户需求等缺点。

2、为解决上述技术问题,本专利技术通过以下技术方案实现:

3、一种更偏向人们喜本文档来自技高网...

【技术保护点】

1.一种更偏向人们喜好的图像生成方法,其特征在于,包括:

2.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,在学习训练时,采用损失函数对CLIP模型进行对比学习,在所述损失函数里新增一个额外的余量作为相似性的差值。

3.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,所述高性能图像生成算法包括stabledifusion、SDXL或DALL2。

4.根据权利要求3所述的一种更偏向人们喜好的图像生成方法,其特征在于,在选取最符合人们喜好的图像时,采用人工投票选取的方式选出一张最符合人们喜好的图像,若票数相同则从票数相...

【技术特征摘要】

1.一种更偏向人们喜好的图像生成方法,其特征在于,包括:

2.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,在学习训练时,采用损失函数对clip模型进行对比学习,在所述损失函数里新增一个额外的余量作为相似性的差值。

3.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,所述高性能图像生成算法包括stabledifusion、sdxl或dall2。

4.根据权利要求3所述的一种更偏向人们喜好的图像生成方法,其特征在于,在选取最符合人们喜好的图像时,采用人工投票选取的方式选出一张最符合人们喜好的图像,若票数相同则从票数相同的图像之间随机选取。

5.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,所述图像数据库包括图像对应的描述与图像热度。

6.根据权利要求1所述的一种更偏向人们喜好的图像生...

【专利技术属性】
技术研发人员:邹辉邢东进杨洪进
申请(专利权)人:厦门蝉羽网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1