视频密集预测方法及其装置制造方法及图纸

技术编号：35791965 阅读：22 留言：0更新日期：2022-12-01 14:41

本申请公开了一种视频密集预测方法及其装置，属于图像处理技术领域。该视频密集预测方法包括：将第一输入数据输入至视频密集预测模型中；其中，第一输入数据包括：第一视频帧、第二视频帧和第一视频帧的第一密集预测结果，第一视频帧为第二视频帧的前一视频帧；通过视频密集预测模型，根据第一输入数据，得到第一中间密集预测结果；其中，第一中间密集预测结果包括：第一密集预测结果中，与第一视频帧和第二视频帧之间相同图像内容对应的密集预测结果；通过视频密集预测模型，根据第一中间密集预测结果，对第二视频帧进行密集预测，得到第二密集预测结果；将第二密集预测结果作为视频密集预测模型的输出结果进行输出。频密集预测模型的输出结果进行输出。频密集预测模型的输出结果进行输出。

全部详细技术资料下载

【技术实现步骤摘要】
视频密集预测方法及其装置

[0001]本申请属于图像处理
，具体涉及一种视频密集预测方法及其装置。

技术介绍

[0002]随着深度学习在计算机视觉任务上的发展，一些通过传统方法比较难解决的任务，因为深度学习方法的引入使得任务被简化。
[0003]目前深度学习的很多成果已经得到具体应用，如将图像的密集预测应用于图像处理中，可以使得图像处理效果更好。例如，将基于密集语义预测的图像分割、深度估计等应用于手机拍照的人像模式中，可以提升拍照效果。
[0004]但现有的密集预测模型，一般是对单张图片进行密集预测，而在利用现有密集预测模型对视频进行密集预测，以基于密集预测结果对视频图像处理时，密集预测模型对不同图像的同一位置处的相同图像内容的密集预测结果可能不同，这种预测不稳定的问题，可能会导致处理后的视频图像在播放时，发生明显的闪烁和抖动问题，视频显示效果差。

技术实现思路

[0005]本申请实施例的目的是提供一种视频密集预测方法及其装置，能够解决现有技术中在基于单张图片的密集预测模型对视频图像进行密集预测时，存在预测结果稳定性低的问题。
[0006]第一方面，本申请实施例提供了一种视频密集预测方法，所述方法包括：
[0007]将第一输入数据输入至视频密集预测模型中；其中，所述第一输入数据包括：第一视频帧、第二视频帧和所述第一视频帧的第一密集预测结果，所述第一视频帧为所述第二视频帧的前一视频帧；
[0008]通过所述视频密集预测模型，根据所述第一输入数据，得到第一中间...

【技术保护点】

【技术特征摘要】
1.一种视频密集预测方法，其特征在于，所述方法包括：将第一输入数据输入至视频密集预测模型中；其中，所述第一输入数据包括：第一视频帧、第二视频帧和所述第一视频帧的第一密集预测结果，所述第一视频帧为所述第二视频帧的前一视频帧；通过所述视频密集预测模型，根据所述第一输入数据，得到第一中间密集预测结果；其中，所述第一中间密集预测结果包括：所述第一密集预测结果中，与所述第一视频帧和所述第二视频帧之间相同图像内容对应的密集预测结果；通过所述视频密集预测模型，根据所述第一中间密集预测结果，对所述第二视频帧进行密集预测，得到第二密集预测结果；将所述第二密集预测结果作为所述视频密集预测模型的输出结果进行输出。2.根据权利要求1所述的视频密集预测方法，其特征在于，所述视频密集预测模型包括视频稳定性模型；所述通过视频密集预测模型，根据所述第一输入数据，得到第一中间密集预测结果，包括：将所述第一输入数据输入至所述视频稳定性模型中；通过所述视频稳定性模型，确定所述第一视频帧与所述第二视频帧之间的相同图像内容；通过所述视频稳定性模型，确定所述第一密集预测结果中与所述相同图像内容对应的密集预测结果；将所述第一密集预测结果中与所述相同图像内容对应的密集预测结果，确定为所述第一中间密集预测结果。3.根据权利要求1所述的视频密集预测方法，其特征在于，所述视频密集预测模型包括：视频稳定性模型和密集预测模型；所述通过视频密集预测模型，根据所述第一输入数据，得到第一中间密集预测结果，包括：将所述第一视频帧和所述第一密集预测结果，输入至所述视频稳定性模型中；通过所述视频稳定性模型，获取所述第一视频帧的第一图像特征，并建立所述第一图像特征与所述第一密集预测结果之间的对应关系，输出对应关系信息；将所述第二视频帧和所述对应关系信息输入至所述密集预测模型中；通过所述密集预测模型，获取所述第二视频帧的第二图像特征；通过所述密集预测模型，确定所述第一图像特征与所述第二图像特征之间的相同图像特征；通过所述密集预测模型，根据所述对应关系信息，将所述第一密集预测结果中与所述相同图像特征对应的密集预测结果，确定为所述第一中间密集预测结果。4.根据权利要求1所述的视频密集预测方法，其特征在于，所述视频密集预测模型包括视频稳定性模型；所述通过视频密集预测模型，根据所述第一输入数据，得到第一中间密集预测结果，包括：将所述第一输入数据输入至所述视频稳定性模型中；
通过所述视频稳定性模型，得到所述第二视频帧与所述第一视频帧之间的光流信息；通过所述视频稳定性模型，利用所述光流信息对所述第一密集预测结果进行插值采样，得到所述第一中间密集预测结果。5.根据权利要求1至4任一项所述的视频密集预测方法，其特征在于，所述视频密集预测模型包括：视频稳定性模型和密集预测模型；所述密集预测模型包括第一编码器，所述第一编码器的数据处理过程包括至少两个处理阶段；所述视频稳定性模型包括第二解码器，所述第二解码器的数据处理过程包括至少一个处理阶段；所述通过所述视频密集预测模型，根据所述第一中间密集预测结果，对所述第二视频帧进行密集预测，得到第二密集预测结果，包括：通过所述密集预测模型，将所述第一中间密集预测结果叠加至第一目标处理阶段的输出结果中，对所述第二视频帧进行密集预测，得到所述第二密集预测结果；其中，所述第一目标处理阶段包括所述第一编码器的至少一个处理阶段；其中，所述第二解码器的第二目标处理阶段的输出结果为所述第一中间密集预测结果，或第一图像特征与所述第一密集预测结果之间的对应关系信息，所述第一图像特征为所述第一视频帧的图像特征，所述第二目标处理阶段包括所述第二解码器的至少一个处理阶段。6.一种视频密集...

【专利技术属性】
技术研发人员：马冰，
申请(专利权)人：维沃移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人