模型训练、视频插帧方法，装置，设备以及存储介质制造方法及图纸

技术编号：29983249 阅读：15 留言：0更新日期：2021-09-08 10:19

本公开提供了模型训练、视频插帧方法，装置，设备以及存储介质，涉及人工智能领域，具体涉及计算机视觉和深度学习技术领域。具体实现方案为：确定插帧位置前后的第一参考帧和第二参考帧对应不同分辨率的第一图像帧集合和第二图像帧集合；分别将第一图像帧集合和第二图像帧集合中的图像帧输入初始光流估计网络，得到第一光流集合和第二光流集合；基于第一光流集合和第二光流集合，确定目标损失函数；根据目标损失函数，训练初始光流估计网络。本实现方式可以对不同分辨率的视频帧进行插帧，提高光流估计的准确性，进而提升视频插帧的效果。进而提升视频插帧的效果。进而提升视频插帧的效果。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练、视频插帧方法，装置，设备以及存储介质

[0001]本公开涉及人工智能领域，具体涉及计算机视觉和深度学习
，尤其涉及模型训练、视频插帧方法，装置，设备以及存储介质。

技术介绍

[0002]视频插帧是视频处理中的一个经典任务，旨在根据一段视频中的前后两帧合成过渡平滑的中间帧。视频插帧的应用场景包括：第一，用于提高设备显示的视频帧率，让用户感觉视频更加清晰流畅；第二，在视频制作和编辑上，用于辅助实现视频的慢动作效果，或者用于在动画的关键帧之间增加中间帧，减少动画制作的人力支出；第三，用于视频的中间帧压缩，或者为其它计算机视觉任务提供辅助数据。

技术实现思路

[0003]本公开提供了一种模型训练、视频插帧方法，装置，设备以及存储介质。
[0004]根据第一方面，提供了一种模型训练方法，包括：确定插帧位置前后的第一参考帧和第二参考帧对应不同分辨率的第一图像帧集合和第二图像帧集合；分别将第一图像帧集合和第二图像帧集合中的图像帧输入初始光流估计网络，得到第一光流集合和第二光流集合；基于第一光流集合和第二光流集合，确定目标损失函数；根据目标损失函数，训练初始光流估计网络。
[0005]根据第二方面，提供了一种视频插帧方法，包括：获取目标视频；根据目标视频中前后相邻的两个视频帧以及通过如第一方面所描述的方法训练得到的光流估计网络，确定相邻的两个视频帧之间的第一光流和第二光流；根据第一光流和第二光流，合成相邻的两个视频帧的中间视频帧。
[0006]根据第三方面，提供了一种模型训练装...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：确定插帧位置前后的第一参考帧和第二参考帧对应不同分辨率的第一图像帧集合和第二图像帧集合；分别将所述第一图像帧集合和所述第二图像帧集合中的图像帧输入初始光流估计网络，得到第一光流集合和第二光流集合；基于所述第一光流集合和所述第二光流集合，确定目标损失函数；根据所述目标损失函数，训练所述初始光流估计网络。2.根据权利要求1所述的方法，其中，所述基于所述第一光流集合和所述第二光流集合，确定目标损失函数，包括：基于所述第一光流集合中的任意两个第一光流和所述第二光流集合中的任意两个第二光流，确定目标损失函数。3.根据权利要求2所述的方法，其中，所述根据所述第一光流集合中的任意两个第一光流和所述第二光流集合中的任意两个第二光流，确定目标损失函数，包括：根据所述初始光流估计网络，从所述不同分辨率中确定出目标分辨率；根据所述目标分辨率对应的目标第一光流和所述第一光流集合中除所述目标第一光流之外的其它第一光流，确定第一损失函数；根据所述目标分辨率对应的目标第二光流和所述第二光流集合中除所述目标第二光流之外的其它第二光流，确定第二损失函数；基于所述第一损失函数和所述第二损失函数，确定所述目标损失函数。4.根据权利要求3所述的方法，其中，所述根据所述初始光流估计网络，从所述不同分辨率中确定出目标分辨率，包括：获取所述初始光流估计网络的训练图像集；确定所述第一图像帧集合或所述第二图像帧集合中的各图像帧与所述训练图像集之间的分辨率相似度；根据各分辨率相似度，从所述不同分辨率中确定出所述目标分辨率。5.根据权利要求1～4任一项所述的方法，其中，所述基于所述第一光流集合和所述第二光流集合，确定目标损失函数，包括：根据所述第一光流集合和所述第二光流集合中相同分辨率的第一光流和第二光流，生成与各分辨率对应的合成帧；根据各合成帧与所述插帧位置对应的真值帧，确定第三损失函数；基于所述第三损失函数，确定所述目标损失函数。6.根据权利要求1～5任一项所述的方法，其中，所述确定插帧位置前后的第一参考帧和第二参考帧对应不同分辨率的第一图像帧集合和第二图像帧集合，包括：对所述第一参考帧和所述第二参考帧进行至少一次下采样，得到所述第一参考帧对应的扩展帧和所述第二参考帧对应的扩展帧；根据所述第一参考帧和对应的扩展帧，确定第一图像帧集合；根据所述第二参考帧和对应的扩展帧，确定第二图像帧集合。7.根据权利要求1～6任一项所述的方法，其中，所述第一图像帧集合各图像帧与所述第二图像帧集合中的各第二图像帧一一对应，对应的两个图像帧的分辨率相同；以及
所述分别将所述第一图像帧集合和所述第二图像帧集合中的图像帧输入初始光流估计网络，得到第一光流集合和第二光流集合，包括：将分辨率相同的第一图像帧与第二图像帧输入所述初始光流估计网络，得到所述第一图像帧与所述第二图像帧之间的第一光流和所述第二图像帧与所述第一图像帧之间的第二光流；根据各第一光流，得到所述第一光流集合；根据各第二光流，得到所述第二光流集合。8.一种视频插帧方法，包括：获取目标视频；根据所述目标视频中前后相邻的两个视频帧以及通过权利要求1
‑
7任一项所描述的方法训练得到的光流估计网络，确定相邻的两个视频帧之间的第一光流和第二光流；根据所述第一光流和所述第二光流，合成所述相邻的两个视频帧的中间视频帧。9.一种模型训练装置，包括：分辨率扩展单元，被配置成确定插帧位置前后的第一参考帧和第二参考帧对应不同分辨率的第一图像帧集合和第二图像帧集合；第一光流计算单元，被配置成分别将所述第一图像帧集合和所述第二图像帧集合中的图像帧输入初始光流估计网络，得到第一光流集合和第...

【专利技术属性】
技术研发人员：郑贺，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人