一种基于高低频特征融合的视频生成方法技术

技术编号：45635643 阅读：4 留言：0更新日期：2025-06-27 18:43

本发明专利技术公开了一种基于高低频特征融合的视频生成方法，属于视频处理领域。低频特征提取：通过全局特征提取器从参考图像中提取低频信息，低频信息包括图像的整体结构、轮廓以及核心关键点图，在模型训练过程中，从输入视频中随机选取某一帧作为参考图像，提取该帧的高频特征和低频特征，并分别注入模型的指定位置；采用扩散模型进行视频生成，通过加噪和去噪的方法优化模型训练过程。本发明专利技术通过分别注入低频特征和经过人脸识别提取并融合的人脸高频特征，使得视频中人物的面部特征及整体细节得以保持一致，从而显著提升生成视频的真实感与连贯性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频处理领域，更具体地说，涉及一种基于高低频特征融合的视频生成方法。

技术介绍

1、目前主流的视频生成算法大多采用文本特征与视频噪声共同输入潜在空间进行学习，推理时在潜在空间内进行多次采样，最终生成视频。然而，这种方法存在以下问题：在长时间序列的视频生成任务中，生成的视频帧之间的物体形态容易出现漂移或不连续，导致一致性较差，尤其是在人物、物体跟踪方面问题尤为明显。

技术实现思路

1、针对这一问题，本方案提出了一种仿古建筑木作营造施工工法。

2、一种基于高低频特征融合的视频生成方法，包括以下步骤：

3、低频特征提取：通过全局特征提取器从参考图像中提取低频信息，低频信息包括图像的整体结构、轮廓以及核心关键点图；采用传统视觉处理技术或深度学习算法对参考图像进行处理，以获得低频特征，其中传统视觉处理技术包括基于像素运算的边缘检测、图像平滑处理、形态学操作，深度学习方法包括目标检测、图像识别、图像分割；采用视频变分自编码器(vae)提取低频特征的潜在空间表示，并...

【技术保护点】

1.一种基于高低频特征融合的视频生成方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于高低频特征融合的视频生成方法，其特征在于，所述低频特征提取过程中，采用基于像素运算的边缘检测、图像平滑处理、形态学操作或深度学习方法中的目标检测、图像识别、图像分割方法进行低频特征提取。

3.根据权利要求1所述的一种基于高低频特征融合的视频生成方法，其特征在于，所述高频特征提取过程中，采用预训练的视觉编码模型提取图像特征，并通过多层感知机进行特征学习，以获得优化后的高频特征。

4.根据权利要求1所述的一种基于高低频特征融合的视频生成方法，其特征在于，在...

【技术特征摘要】

1.一种基于高低频特征融合的视频生成方法，其特征在于，包括以下步骤：

4.根据权利要求1所述的一种基于高低频特征融合的视频生成方法，其特征在于，在人物一致性保持场景中，额外采用人脸识别模型提取人脸特征，并通过融合模块对人脸特征和物体高频特征进行融合，以得到最终的高频特征。

5.根据权利要求1所述的一种...

【专利技术属性】
技术研发人员：白立华，施其明，刘永坚，姜瑜，李媛媛，
申请(专利权)人：数传上海企业发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人