当前位置: 首页 > 专利查询>河北大学专利>正文

一种基于运动感知和时间风格调制的场景视频生成方法技术

技术编号:44585940 阅读:19 留言:0更新日期:2025-03-14 12:46
本发明专利技术为基于运动感知和时间风格调制的场景视频生成方法,涉及机器学习技术领域,包括通过使用运动感知矩阵和时间风格调制的方式在StyleGAN‑V的基础上进行场景记忆生成。该框架将生成的时间噪声作为输入,在经过时间低通滤波器平滑后,被映射到中间潜伏序列{w<subgt;t</subgt;}。利用相邻帧的中间隐变量的余弦相似度构建运动矩阵。该框架还使用了注意力机制提高该方法对时间依赖性和视频帧之间的变化的理解。在合成网络层将运动感知矩阵和中间潜伏序列作为输入,处理后并通过增强条件特征进行卷积,最终输出256x144分辨率的场景记忆视频帧。

【技术实现步骤摘要】

本专利技术涉及机器学习,尤其涉及一种基于运动感知和时间风格调制的场景视频生成方法和系统。


技术介绍

1、现有的场景记忆生成方法可分为三组:场景记忆以图像补全的形式生成、场景记忆通过gan以视频的形式生成、场景记忆通过扩散模型以视频的形式生成。

2、(1)场景记忆以图像语义补全的形式生成

3、图像语义补全是计算机视觉中的一个重要研究领域,旨在根据图像中现有部分的语义对图像中的缺失或损坏部分进行填补,使其恢复成完整的图像。该领域的传统方法有纹理合成、图像分割和拼接以及稀疏编码等。在场景记忆生成领域,根据一个中心假设:海马体是以记忆痕迹的形式存储和检索事件的,这必然不是完整的。在回忆时,新皮层根据一般的语义信息合理地填补缺失的部分,这一过程就是语义补全。现有的利用图像语义补全的形式生成场景记忆的方法是利用了vq-vae对前馈和反馈连接的感知语义网络进行建模以及利用了pixelcnn对感知语义网络语义端的循环连接进行建模,通过假设的存储和检索以图像记忆帧的形式在一定程度上模拟了海马体。但是场景记忆不只是静态的,使用图像语义补全的方法进行场景本文档来自技高网...

【技术保护点】

1.一种基于运动感知和时间风格调制的场景视频生成方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于运动感知和时间风格调制的场景视频生成方法,其特征在于,还包括,构建构建运动感知矩阵Mi-1,i之后,引入注意力机制对运动感知矩阵Mi-1,i进行约束,包括以下步骤:

3.如权利要求2所述的基于运动感知和时间风格调制的场景视频生成方法,其特征在于,所述增强条件表示为:

4.如权利要求1所述的基于运动感知和时间风格调制的场景视频生成方法,其特征在于,所述通过增强条件特征进行卷积,生成场景记忆,包括以下步骤:

5.如权利要求4所述的基于运动...

【技术特征摘要】

1.一种基于运动感知和时间风格调制的场景视频生成方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于运动感知和时间风格调制的场景视频生成方法,其特征在于,还包括,构建构建运动感知矩阵mi-1,i之后,引入注意力机制对运动感知矩阵mi-1,i进行约束,包括以下步骤:

3.如权利要求2所述的基于运动感知和时间风格调制的场景视频生成方法,其特征在于,所述增强条件表示为:

4.如权利要求1所述的基于运动感知和时间风格调制的场景视频生成方法,其特征在于,所述通过增强条件特征进行卷积,生成场景记忆,包括以下步骤:

...

【专利技术属性】
技术研发人员:王亮王昭左丽娜
申请(专利权)人:河北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1