【技术实现步骤摘要】
本专利技术属于计算机视觉和机器学习,具体涉及视频预测任务中的时序特征提取和深度学习模型设计。
技术介绍
1、视频预测是一项重要且具有挑战性的任务,其旨在根据先前观测到的帧生成未来的帧。这种能够预测复杂时空间信息的能力在交通流量预测、天气预报、人类行为预测和自动驾驶等领域引起了广泛的研究兴趣。然而,构建精确的预测模型是一项巨大的挑战,因为它需要处理包括空间和时间信息的多维数据。
2、当前,构建深度学习模型解决复杂的视频预测问题是当前的主流方案。近年来的许多深度学习模型为视频预测技术带来了重大发展。当前,基于深度学习的视频图像预测模型一般分为三种类型:第一种,基于自编码器网络(ae)构建的预测模型;第二种,基于生成对抗网络(gan)构建的预测模型;第三种,基于循环神经网络(rnn)构建的预测模型,目前业界的主流方式是构建循环神经网络以进行视频预测。介于视频序列同时具有时间和空间维度上的复杂信息,近年来提出的模型都是以rnn混合cnn的架构对时间和空间信息分别处理。例如能够同时捕获时序和空间信息的卷积长短期记忆网络(convlst
...【技术保护点】
1.一种基于时空聚合运动感知的视频预测方法,该方法包括:
2.如权利要求1所述的一种基于时空聚合运动感知的视频预测方法,其特征在于,所述通道缩减和通道扩张由1×1的二维卷积、批归一化、激活函数组成。
3.如权利要求1所述的一种基于时空聚合运动感知的视频预测方法,其特征在于,所述时空聚合运动感知模块在STMDAUnit中以并列方式存在两个,它们的区别在于分组数不同;时空聚合运动感知模块分成以残差形式连接的两个部分:时空聚合门控模块和运动方向多层感知器MDA-MLP。
4.如权利要求3所述的一种基于时空聚合运动感知的视频预测方法,其特征
...【技术特征摘要】
1.一种基于时空聚合运动感知的视频预测方法,该方法包括:
2.如权利要求1所述的一种基于时空聚合运动感知的视频预测方法,其特征在于,所述通道缩减和通道扩张由1×1的二维卷积、批归一化、激活函数组成。
3.如权利要求1所述的一种基于时空聚合运动感知的视频预测方法,其特征在于,所述时空聚合运动感知模块在stmdaunit中以并列方式存在两个,它们的区别在于分组数不同;时空聚合运动感知模块分成以残差...
【专利技术属性】
技术研发人员:甘炼强,赖俊宇,刘华烁,鞠京泽,李昱航,李滚,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。