【技术实现步骤摘要】
本专利技术涉及视频处理领域,更具体地说,涉及一种基于高低频特征融合的视频生成方法。
技术介绍
1、目前主流的视频生成算法大多采用文本特征与视频噪声共同输入潜在空间进行学习,推理时在潜在空间内进行多次采样,最终生成视频。然而,这种方法存在以下问题:在长时间序列的视频生成任务中,生成的视频帧之间的物体形态容易出现漂移或不连续,导致一致性较差,尤其是在人物、物体跟踪方面问题尤为明显。
技术实现思路
1、针对这一问题,本方案提出了一种仿古建筑木作营造施工工法。
2、一种基于高低频特征融合的视频生成方法,包括以下步骤:
3、低频特征提取:通过全局特征提取器从参考图像中提取低频信息,低频信息包括图像的整体结构、轮廓以及核心关键点图;采用传统视觉处理技术或深度学习算法对参考图像进行处理,以获得低频特征,其中传统视觉处理技术包括基于像素运算的边缘检测、图像平滑处理、形态学操作,深度学习方法包括目标检测、图像识别、图像分割;采用视频变分自编码器(vae)提取低频特征的潜在空间表示,并
...【技术保护点】
1.一种基于高低频特征融合的视频生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于高低频特征融合的视频生成方法,其特征在于,所述低频特征提取过程中,采用基于像素运算的边缘检测、图像平滑处理、形态学操作或深度学习方法中的目标检测、图像识别、图像分割方法进行低频特征提取。
3.根据权利要求1所述的一种基于高低频特征融合的视频生成方法,其特征在于,所述高频特征提取过程中,采用预训练的视觉编码模型提取图像特征,并通过多层感知机进行特征学习,以获得优化后的高频特征。
4.根据权利要求1所述的一种基于高低频特征融合的视频生成
...【技术特征摘要】
1.一种基于高低频特征融合的视频生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于高低频特征融合的视频生成方法,其特征在于,所述低频特征提取过程中,采用基于像素运算的边缘检测、图像平滑处理、形态学操作或深度学习方法中的目标检测、图像识别、图像分割方法进行低频特征提取。
3.根据权利要求1所述的一种基于高低频特征融合的视频生成方法,其特征在于,所述高频特征提取过程中,采用预训练的视觉编码模型提取图像特征,并通过多层感知机进行特征学习,以获得优化后的高频特征。
4.根据权利要求1所述的一种基于高低频特征融合的视频生成方法,其特征在于,在人物一致性保持场景中,额外采用人脸识别模型提取人脸特征,并通过融合模块对人脸特征和物体高频特征进行融合,以得到最终的高频特征。
5.根据权利要求1所述的一种...
【专利技术属性】
技术研发人员:白立华,施其明,刘永坚,姜瑜,李媛媛,
申请(专利权)人:数传上海企业发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。