内容生成方法及装置制造方法及图纸

技术编号：46090872 阅读：10 留言：0更新日期：2025-08-12 18:10

本申请实施例公开了一种内容生成方法及装置。主要技术方案包括：获取输入数据，所述输入数据至少包括第一控制条件；利用第一内容生成模型，基于预先存储的引导权重曲线中每个时间步对应的引导权重，对噪声媒体内容进行去噪处理，生成与所述第一控制条件对应的第一目标媒体内容；其中，所述第一内容生成模型采用无分类器引导的扩散模型，所述引导权重为所述去噪处理过程中预测噪声时引导向量对应的权重，所述引导向量为基于所述第一控制条件预测的第一噪声向量与无提示条件下预测的第二噪声向量的差值。本申请能够提高媒体内容生成质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，具体涉及一种内容生成方法及装置。

技术介绍

1、随着人工智能技术的飞速发展，人工智能生成内容（ai-generated content，aigc）在近年来取得了显著的突破，尤其是基于扩散模型的文本生成图像（text-to-image）和文本生成视频（text-to-video）技术，因其卓越的生成质量和丰富的多样性，成为了当前研究与应用的热点方向。扩散模型通过逐步去噪的过程，能够将一个初始的纯噪声张量转换为符合用户文本描述的图像或视频内容。

2、在现有的扩散模型中，无分类器引导（classifier-free guidance, cfg）技术被广泛应用以增强生成内容对文本指令的遵循能力。该技术通过在无条件预测和有条件预测之间进行插值来引导生成过程，使得生成的图像或视频能够更紧密地贴合用户的文本提示。然而，现有的cfg方案普遍依赖固定的引导权重，该引导权重通常被设置为固定值，或通过人工经验预先设置。这种固定权重的方式会显著影响生成内容的质量。

技术实现思路

>1、有鉴于此，本申本文档来自技高网...

【技术保护点】

1.一种内容生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一内容生成模型包括有条件模型和无条件模型；

3.根据权利要求2所述的方法，其特征在于，所述有条件模型和所述无条件模型满足以下至少一种非对称条件：

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述预先存储的引导权重曲线按照如下方式构建：

5.根据权利要求4所述的方法，其特征在于，所述确定由可调整的参数集合控制的曲线函数，包括：

6.根据权利要求4所述的方法，其特征在于，所述测试样本集中包括至少一个第二控制条件；

...

【技术特征摘要】

1.一种内容生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一内容生成模型包括有条件模型和无条件模型；

3.根据权利要求2所述的方法，其特征在于，所述有条件模型和所述无条件模型满足以下至少一种非对称条件：

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述预先存储的引导权重曲线按照如下方式构建：

5.根据权利要求4所述的方法，其特征在于，所述确定由可调整的参数集合控制的曲线函数，包括：

6.根据权利要求4所述的方法...

【专利技术属性】
技术研发人员：侯良，姜博源，高远，陶鑫，万鹏飞，张迪，盖坤，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人