自定义形象的生成方法及装置制造方法及图纸

技术编号：40273656 阅读：10 留言：0更新日期：2024-02-02 22:59

本申请提供了一种自定义形象的生成方法及装置。该方法包括：确定目标对象所属的第一类别和其特殊标记，获取目标对象的第一数量的第一样本；通过扩散模型输出属于第一类别但不为目标对象的第二数量的第二样本；为各个第二样本添加噪声，通过各个添加噪声后的第二样本和第一类别的文本信息训练扩散模型；为各个第一样本添加噪声，通过各个添加噪声后的第一样本和特殊标记的文本信息训练扩散模型；获取形象自定义指令的文本信息，利用最终训练得到的扩散模型在形象自定义指令的文本信息的指导下生成目标对象的自定义形象。采用上述技术手段，解决现有技术中，无法生成高质量的自定义形象的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及机器学习，尤其涉及一种自定义形象的生成方法及装置。

技术介绍

1、在各种应用场景中，常常需要根据用户的文字描述，为用户生成个性化定制风格图片或人物形象，该过程称为自定义形象生成。现有技术中也常使用扩散模型生成自定义形象，但是该方法无法生成高质量的自定义形象。

技术实现思路

1、有鉴于此，本申请实施例提供了一种自定义形象的生成方法、装置、电子设备及计算机可读存储介质，以解决现有技术中，无法生成高质量的自定义形象的问题。

2、本申请实施例的第一方面，提供了一种自定义形象的生成方法，包括：确定目标对象所属的第一类别和其特殊标记，获取目标对象的第一数量的第一样本；通过扩散模型输出属于第一类别但不为目标对象的第二数量的第二样本，其中，扩散模型已通过预训练，能按要求输出样本以及为样本增加各种特效，第二数量是第一数量的预设倍；为各个第二样本添加噪声，通过各个添加噪声后的第二样本和第一类别的文本信息训练扩散模型，其中，在该训练过程中第一类别的文本信息作为条件指导；为各个第一样本添加噪声，通过各个添加噪声后的第一样本和特殊标记的文本信息训练扩散模型，其中，在该训练过程中特殊标记的文本信息作为条件指导；获取形象自定义指令的文本信息，利用最终训练得到的扩散模型在形象自定义指令的文本信息的指导下生成目标对象的自定义形象。

3、本申请实施例的第二方面，提供了一种自定义形象的生成装置，包括：确定模块，被配置为确定目标对象所属的第一类别和其特殊标记，获取目标对象的第一数量的第一

4、本申请实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

5、本申请实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

6、本申请实施例与现有技术相比存在的有益效果是：因为本申请实施例通过确定目标对象所属的第一类别和其特殊标记，获取目标对象的第一数量的第一样本；通过扩散模型输出属于第一类别但不为目标对象的第二数量的第二样本，其中，扩散模型已通过预训练，能按要求输出样本以及为样本增加各种特效，第二数量是第一数量的预设倍；为各个第二样本添加噪声，通过各个添加噪声后的第二样本和第一类别的文本信息训练扩散模型，其中，在该训练过程中第一类别的文本信息作为条件指导；为各个第一样本添加噪声，通过各个添加噪声后的第一样本和特殊标记的文本信息训练扩散模型，其中，在该训练过程中特殊标记的文本信息作为条件指导；获取形象自定义指令的文本信息，利用最终训练得到的扩散模型在形象自定义指令的文本信息的指导下生成目标对象的自定义形象。采用上述技术手段，可以解决现有技术中，无法生成高质量的自定义形象的问题，进而提高生成的自定义形象的质量。

本文档来自技高网...

【技术保护点】

1.一种自定义形象的生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，通过扩散模型输出属于所述第一类别但不为所述目标对象的第二数量的第二样本之后，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，获取形象自定义指令的文本信息，利用最终训练得到的所述扩散模型在所述形象自定义指令的文本信息的指导下生成所述目标对象的自定义形象之前，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，获取形象自定义指令的文本信息，利用最终训练得到的所述扩散模型在所述形象自定义指令的文本信息的指导下生成所述目标对象的自定义形象之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，获取形象自定义指令的文本信息，利用最终训练得到的所述扩散模型在所述形象自定义指令的文本信息的指导下生成所述目标对象的自定义形象之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，通过扩散模型输出属于所述第一类别但不为所述目标对象的第二数量的第二样本之后，所述方法还包括：

7.根据权利要求6所述的

8.一种自定义形象的生成装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，其特征在于，处理器执行计算机程序时实现如权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，其特征在于，计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种自定义形象的生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，通过扩散模型输出属于所述第一类别但不为所述目标对象的第二数量的第二样本之后，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，获取形象自定义指令的文本信息，利用最终训练得到的所述扩散模型在所述形象自定义指令的文本信息的指导下生成...

【专利技术属性】
技术研发人员：董辉，暴宇健，
申请(专利权)人：深圳须弥云图空间科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人