【技术实现步骤摘要】
本专利技术涉及图像处理,具体而言,涉及一种基于文生图的图像生成方法及装置。
技术介绍
1、“文生图”这种系统通常指将用户输入的文本描述生成为对应的图像。这里面需首先利用自然语言处理(nlp)对输入的文本进行解析,分析理解词汇、句法结构和语义关系,以提取文本中的语义信息。然后再利用计算机视觉技术,如潜在扩散模型stablediffusion,利用自动编码器将输入的样本图像压缩到1atent空间,转化为压缩的特征图,在特征图的基础上加噪、去噪,最终进行解码来生成高质量的图像。
2、现在市场上的文生图产品,生成的数据虽然多样,但难以保证结果是适合用户的。比如对于同样的prompt输入,不同年龄、性别、兴趣的用户,生成的偏好也可能不一样。如儿童偏好于卡通风格;年轻人可能更偏好二次元风格的图片输出;老人可能喜欢写实、照片风格;男生可能喜欢硬朗风格,女生喜欢可爱温馨风格;it工作者可能喜欢科技感、机械感的图片;传统文化工作者的可能喜欢水墨画风格。
3、针对上述相关技术中文生图技术无法为用户生成个性化风格的图片的问题,目前尚未
...【技术保护点】
1.一种基于文生图的图像生成方法,其特征在于,包括:
2.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,对所述文本描述信息和所述标签信息进行文本扩充,以得到包含用户画像特征和语义特征的完整文本描述,包括:
3.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,获取所述完整文本描述信息对应的图片信息生成向量,包括:
4.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,将所述图片信息生成向量输入至文生图模型中,以利用所述文生图模型对所述图片信息生成向量进行处理,得到多张图片,包括:
5.根据权利
...【技术特征摘要】
1.一种基于文生图的图像生成方法,其特征在于,包括:
2.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,对所述文本描述信息和所述标签信息进行文本扩充,以得到包含用户画像特征和语义特征的完整文本描述,包括:
3.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,获取所述完整文本描述信息对应的图片信息生成向量,包括:
4.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,将所述图片信息生成向量输入至文生图模型中,以利用所述文生图模型对所述图片信息生成向量进行处理,得到多张图片,包括:
5.根据权利要求1所述的基于文生图的图像生成方法,其特征在于,对所述多张图片进行打分,得到所述多张图片中每一张图片的打分值,包括:
6.根...
【专利技术属性】
技术研发人员:赵必美,梁寿愚,姚森敬,卢志良,董召杰,敖榜,刘懋,吴石松,姜诚,任正国,郭尧,杨伟,王鹏凯,陈骞,陈元峰,郑桦,李成,
申请(专利权)人:南方电网人工智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。