【技术实现步骤摘要】
本专利技术涉及人工智能,具体而言,涉及一种更偏向人们喜好的图像生成方法、装置、设备及介质。
技术介绍
1、现有的ai图像深度生成模型可以根据人们的输入需求,短时间生成大量图片,但这些图片不太符合人们的喜好,导致用户需要再次精挑细选。
2、clip模型是一个多模态架构的文本图像预训练模型,它可以交叉理解图像和文本的关系。clip将提示词转换为与文本描述对应的高维空间向量表示,使得该向量能够捕捉到提示词所包含的语义信息。然而,目前的clip对人类意图无法精准表达,无法对同类型图片的偏好特征进行学习,也不能根据用户的行为更新人类的偏好,从而影响后续的图片生成效果,用户体验不佳。
3、有鉴于此,申请人在研究了现有的技术后特提出本申请。
技术实现思路
1、本专利技术旨在提供一种更偏向人们喜好的图像生成生成方法、装置、设备及介质,以解决现有方法中生成的图像与人们喜好不一致、不符合用户需求等缺点。
2、为解决上述技术问题,本专利技术通过以下技术方案实现:
...
【技术保护点】
1.一种更偏向人们喜好的图像生成方法,其特征在于,包括:
2.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,在学习训练时,采用损失函数对CLIP模型进行对比学习,在所述损失函数里新增一个额外的余量作为相似性的差值。
3.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,所述高性能图像生成算法包括stabledifusion、SDXL或DALL2。
4.根据权利要求3所述的一种更偏向人们喜好的图像生成方法,其特征在于,在选取最符合人们喜好的图像时,采用人工投票选取的方式选出一张最符合人们喜好的图像,
...【技术特征摘要】
1.一种更偏向人们喜好的图像生成方法,其特征在于,包括:
2.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,在学习训练时,采用损失函数对clip模型进行对比学习,在所述损失函数里新增一个额外的余量作为相似性的差值。
3.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,所述高性能图像生成算法包括stabledifusion、sdxl或dall2。
4.根据权利要求3所述的一种更偏向人们喜好的图像生成方法,其特征在于,在选取最符合人们喜好的图像时,采用人工投票选取的方式选出一张最符合人们喜好的图像,若票数相同则从票数相同的图像之间随机选取。
5.根据权利要求1所述的一种更偏向人们喜好的图像生成方法,其特征在于,所述图像数据库包括图像对应的描述与图像热度。
6.根据权利要求1所述的一种更偏向人们喜好的图像生...
【专利技术属性】
技术研发人员:邹辉,邢东进,杨洪进,
申请(专利权)人:厦门蝉羽网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。