经由时间渐进式学习的高效视频处理制造技术

技术编号：42499995 阅读：30 留言：0更新日期：2024-08-22 14:12

本文提供了用于为视频处理执行时间渐进式学习的系统和方法。一些示例包括接收包括多个帧的视频、从多个帧中提取第一帧子集，以及将第一帧子集输入到包括编码器和解码器的模型中。这些示例另外包括将模型的第一输出与第一帧子集进行比较并更新编码器，从而训练编码器，并且从多个帧中提取第二帧子集。第二帧子集包括比第一帧子集中的帧的数目多的数目的帧。这些示例另外包括将第二帧子集输入到模型中，将模型的第二输出与第二帧子集进行比较，并且更新编码器，从而进一步训练编码器。

全部详细技术资料下载

【技术实现步骤摘要】

技术介绍

1、随着模型容量和数据规模的不断增长，大规模预训练正逐渐成为计算机视觉领域中机器学习算法(诸如深度神经网络)的标准范例。基于图像和视频的掩码自编码器(masked auto encoder，mae)由于其鲁棒性、简单性和有效性而成为最热门的自监督方法之一。然而，训练摄像师既缓慢又昂贵。例如，在常规数据集上训练videomae模型可能需要五天以上的时间和64个图形处理单元(gpu)，这阻碍了videomae对计算预算有限的用户的可访问性，并且限制了其对更大数据集的扩展。

2、实施例是针对这些和其他一般考虑事项已经进行描述的。此外，尽管已经论述了相对具体的问题，但是应理解，实施例不应限于解决
技术介绍
中确定的具体问题。

技术实现思路

1、本公开的各方面涉及为视频处理执行时间渐进式学习的方法、系统和介质。

2、在一些示例中，提供了一种针对视频处理执行时间渐进式学习的方法。该方法包括：接收包括多个帧的视频流；从多个帧中提取第一帧子集；将第一帧子集输入到模型中，其中...

【技术保护点】

1.一种针对视频处理执行时间渐进式学习的方法，所述方法包括：

2.根据权利要求1所述的方法，其中所述模型是掩码自编码器MAE模型。

3.根据权利要求2所述的方法，其中所述第一帧子集和所述第二帧子集中的每个帧在被输入到所述MAE模型中之前被随机掩码。

4.根据权利要求1所述的方法，其中所述第一帧子集和所述第二帧子集从所述多个帧被随机选择。

5.根据权利要求1所述的方法，其中所述第二帧子集包括两倍于所述第一帧子集的帧。

6.根据权利要求1所述的方法，在提供所述模型之前，还包括：

7.根据权利要求6所述的方法，其中所述第三...

【技术特征摘要】

1.一种针对视频处理执行时间渐进式学习的方法，所述方法包括：

2.根据权利要求1所述的方法，其中所述模型是掩码自编码器mae模型。

3.根据权利要求2所述的方法，其中所述第一帧子集和所述第二帧子集中的每个帧在被输入到所述mae模型中之前被随机掩码。

4.根据权利要求1所述的方法，其中所述第一帧子集和所述第二帧子集从所述多个帧被随机选择。

5.根据权利要求1所述的方法，其中所述第二帧子集包括两倍于所述第一帧子集的帧。

6.根据权利要求1所述的方法，在提供所述模型之前，还包括：

7.根据权利要求6所述的方法，其中所述第三帧子集包括两倍于所述第二帧子集的帧。

8.根据权利要求1所述的方法，其中所述提取、所述输入和所述比较的每个序列限定相应的阶段，并且其中针对每个阶段的所述帧子集中所提取的帧的数目是基于阶段的总数目和计算预算而被确定的。

9.一种用于针对视频处理执行时间渐进式学习的系统，所述系统包括：

10.根据权利要求9所述的方法，其中所述模型是掩码自编码器mae模型。

11.根据权利要求10所述的方法，其中所述第一帧子集和所述第二帧子集中的每个帧在被输入到所述mae...

【专利技术属性】
技术研发人员：王鹏，王恒，李先航，李新煜，
申请(专利权)人：脸萌有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人