一种基于AI识别的图像生成方法及系统技术方案

技术编号:43808890 阅读:36 留言:0更新日期:2024-12-27 13:25
本发明专利技术提供一种基于AI识别的图像生成方法及系统,包括如下步骤:S1、获取用户输入文本数据;S2、将文本数据内容进行切片处理,得到多个切片内容;S3、利用Transformer模型分别对多个切片内容进行识别与目标预测;S4、构建图像生成模型及训练;S5、将步骤S3的多个目标预测结果转换为图像特征向量输入图像生成模型中生成多张初始图像;S6、通过平均值融合方式对多张初始图像进行融合;S7、对融合的图像进行图像修复获取最终图像,本发明专利技术通过将预测的目标物体及其属性转换为图像特征向量,并输入到图像生成模型中生成多张不同的初始图像,采用平均值融合的方式将多张初始图像合并成一张综合图像,以提高图像的质量和一致性,避免发生遮挡现象。

【技术实现步骤摘要】

本专利技术涉及图像生成,尤其涉及一种基于ai识别的图像生成方法及系统。


技术介绍

1、基于ai识别的图像生成方法及系统通常是指利用人工智能技术来创建新的图像或者对现有图像进行修改和增强,这类技术和系统在多个领域都有应用,例如艺术创作、设计、娱乐、教育以及科学研究等。

2、当前的ai生成图像技术虽然取得了显著的进步,但在处理包含多个目标的复杂场景时仍然存在一定的局限性:将ai图像生成技术应用于图像压缩时,利用图像压缩算法来指导模型的学习过程,使得压缩后的图像既具有较小的文件大小又尽可能保持高质量,传统的图像压缩算法使用离散余弦变换(dct)来去除图像中的冗余信息,这种方法虽然有效,但在高压缩比下容易产生可见的伪影,在生成图像的过程中,即使能够准确识别目标,当多个目标出现在同一场景中时,它们之间可能会发生遮挡现象,无法正确地安排各个目标的位置和相互关系,将这些目标准确地放置在生成的图像中仍是一项挑战。

3、因此,有必要提供一种新的基于ai识别的图像生成方法及系统解决上述技术问题。


技术实现思路

本文档来自技高网...

【技术保护点】

1.一种基于AI识别的图像生成方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于AI识别的图像生成方法,其特征在于,所述步骤S3中利用Transformer模型进行识别与目标预测包括如下步骤:

3.根据权利要求1所述的基于AI识别的图像生成方法,其特征在于,所述切片处理可根据字符固定长度或单词数量或文本中明确的分隔符进行分割切片。

4.根据权利要求1所述的基于AI识别的图像生成方法,其特征在于,所述训练数据集中的每张图像按照自身情况缩放到相应的比例,并进行随机裁剪,使其大小为256×256像素。

5.根据权利要求1所述的基于AI...

【技术特征摘要】

1.一种基于ai识别的图像生成方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于ai识别的图像生成方法,其特征在于,所述步骤s3中利用transformer模型进行识别与目标预测包括如下步骤:

3.根据权利要求1所述的基于ai识别的图像生成方法,其特征在于,所述切片处理可根据字符固定长度或单词数量或文本中明确的分隔符进行分割切片。

4.根据权利要求1所述的基于ai识别的图像生成方法,其特征在于,所述训练数据集中的每张图像按照自身情况缩放到相应的比例,并进行随机裁剪,使其大小为256×256像素。

5.根据权利要求1所述的基于ai识别...

【专利技术属性】
技术研发人员:郑胤
申请(专利权)人:宝琳创展国际文化科技发展北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1