文本到图像生成方法、装置、设备及介质制造方法及图纸

技术编号:46604456 阅读:1 留言:0更新日期:2025-10-10 21:36
本发明专利技术涉及人工智能领域,提供了一种文本到图像生成方法、装置、设备及介质,可应用于金融、医疗领域,其方法包括:获取描述文本和目标参考姿态;基于编码策略对描述文本进行编码处理得到文本特征;基于提取策略对目标参考姿态进行提取处理得到姿态特征;基于融合策略对文本特征和姿态特征进行融合处理得到融合特征;基于生成策略对融合特征进行生成处理得到目标图像。通过实施本发明专利技术实施例实现了基于编码策略、提取策略、融合策略和生成策略对描述文本和目标参考姿态分别进行对应处理得到融合特征,以基于生成策略对融合特征进行生成处理得到目标图像,实现了对目标图像中人物姿态的精确控制,提高了处理效率。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,尤其涉及一种文本到图像生成方法、装置、设备及介质


技术介绍

1、目前,文本到图像生成技术在生成对抗网络(gan)和扩散模型的推动下取得了显著进展,能够根据自然语言描述生成高质量的图像。然而,现有方法在医疗或者金融等领域生成特定姿态的人物图像时仍面临挑战,主要原因在于:传统文本条件生成模型对姿态的控制依赖于文本描述的隐式编码,难以实现关键点级别的精确调控;基于监督学习的姿态控制方法需要大量带标注的三维姿态数据,标注成本高昂且泛化能力受限,从而导致处理效率低。

2、因此,现有的文本到图像生成方法存在处理效率低的问题。


技术实现思路

1、本专利技术实施例提供了一种文本到图像生成方法、装置、设备及介质,旨在解决现有技术中文本到图像生成方法存在处理效率低的问题。

2、为了解决上述问题,第一方面,本专利技术实施例提供了一种文本到图像生成方法,其包括:

3、获取描述文本和目标参考姿态;

4、基于编码策略对所述描述文本进行编码处理得到文本特征;...

【技术保护点】

1.一种文本到图像生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于提取策略对所述目标参考姿态进行提取处理得到姿态特征之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于提取策略对所述目标参考姿态进行提取处理得到姿态特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于融合策略对所述文本特征和所述姿态特征进行融合处理得到融合特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于编码策略对所述描述文本进行编码处理得到文本特征,包括:

6.根据权利要求1所述的方法,其特...

【技术特征摘要】

1.一种文本到图像生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于提取策略对所述目标参考姿态进行提取处理得到姿态特征之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于提取策略对所述目标参考姿态进行提取处理得到姿态特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于融合策略对所述文本特征和所述姿态特征进行融合处理得到融合特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于编码策略对所述描述文本进行编码处理得到文本特征,包括:

6.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:郑喜民舒畅陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1