基于文生图的图像生成方法及装置制造方法及图纸

技术编号:41265235 阅读:47 留言:0更新日期:2024-05-11 09:21
本发明专利技术公开了一种基于文生图的图像生成方法及装置。其中,该方法包括:获取用户输入的文本描述信息和用户的标签信息;对文本描述信息和标签信息进行文本扩充,以得到包含用户画像特征和语义特征的完整文本描述;获取完整文本描述信息对应的图片信息生成向量;将图片信息生成向量输入至文生图模型中,以利用文生图模型对图片信息生成向量进行处理,得到多张图片;对多张图片进行打分,得到多张图片中每一张图片的打分值;将多张图片中打分值大于预定分值的部分图片发送至终端设备;获取用户基于终端设备对部分图片的反馈信息,并基于反馈信息确定目标图像。本发明专利技术解决了相关技术中文生图技术无法为用户生成个性化风格的图片的技术问题。

【技术实现步骤摘要】

本专利技术涉及图像处理,具体而言,涉及一种基于文生图的图像生成方法及装置


技术介绍

1、“文生图”这种系统通常指将用户输入的文本描述生成为对应的图像。这里面需首先利用自然语言处理(nlp)对输入的文本进行解析,分析理解词汇、句法结构和语义关系,以提取文本中的语义信息。然后再利用计算机视觉技术,如潜在扩散模型stablediffusion,利用自动编码器将输入的样本图像压缩到1atent空间,转化为压缩的特征图,在特征图的基础上加噪、去噪,最终进行解码来生成高质量的图像。

2、现在市场上的文生图产品,生成的数据虽然多样,但难以保证结果是适合用户的。比如对于同样的prompt输入,不同年龄、性别、兴趣的用户,生成的偏好也可能不一样。如儿童偏好于卡通风格;年轻人可能更偏好二次元风格的图片输出;老人可能喜欢写实、照片风格;男生可能喜欢硬朗风格,女生喜欢可爱温馨风格;it工作者可能喜欢科技感、机械感的图片;传统文化工作者的可能喜欢水墨画风格。

3、针对上述相关技术中文生图技术无法为用户生成个性化风格的图片的问题,目前尚未提出有效的解决方案。本文档来自技高网...

【技术保护点】

1.一种基于文生图的图像生成方法,其特征在于,包括:

2.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,对所述文本描述信息和所述标签信息进行文本扩充,以得到包含用户画像特征和语义特征的完整文本描述,包括:

3.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,获取所述完整文本描述信息对应的图片信息生成向量,包括:

4.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,将所述图片信息生成向量输入至文生图模型中,以利用所述文生图模型对所述图片信息生成向量进行处理,得到多张图片,包括:

5.根据权利要求1所述的基于文生...

【技术特征摘要】

1.一种基于文生图的图像生成方法,其特征在于,包括:

2.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,对所述文本描述信息和所述标签信息进行文本扩充,以得到包含用户画像特征和语义特征的完整文本描述,包括:

3.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,获取所述完整文本描述信息对应的图片信息生成向量,包括:

4.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,将所述图片信息生成向量输入至文生图模型中,以利用所述文生图模型对所述图片信息生成向量进行处理,得到多张图片,包括:

5.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,对所述多张图片进行打分,得到所述多张图片中每一张图片的打分值,包括:

6.根...

【专利技术属性】
技术研发人员:赵必美梁寿愚姚森敬卢志良董召杰敖榜刘懋吴石松姜诚任正国郭尧杨伟王鹏凯陈骞陈元峰郑桦李成
申请(专利权)人:南方电网人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1