【技术实现步骤摘要】
技术介绍
1、随着模型容量和数据规模的不断增长,大规模预训练正逐渐成为计算机视觉领域中机器学习算法(诸如深度神经网络)的标准范例。基于图像和视频的掩码自编码器(masked auto encoder,mae)由于其鲁棒性、简单性和有效性而成为最热门的自监督方法之一。然而,训练摄像师既缓慢又昂贵。例如,在常规数据集上训练videomae模型可能需要五天以上的时间和64个图形处理单元(gpu),这阻碍了videomae对计算预算有限的用户的可访问性,并且限制了其对更大数据集的扩展。
2、实施例是针对这些和其他一般考虑事项已经进行描述的。此外,尽管已经论述了相对具体的问题,但是应理解,实施例不应限于解决
技术介绍
中确定的具体问题。
技术实现思路
1、本公开的各方面涉及为视频处理执行时间渐进式学习的方法、系统和介质。
2、在一些示例中,提供了一种针对视频处理执行时间渐进式学习的方法。该方法包括:接收包括多个帧的视频流;从多个帧中提取第一帧子集;将第一帧子集输入到模型中,其中
...【技术保护点】
1.一种针对视频处理执行时间渐进式学习的方法,所述方法包括:
2.根据权利要求1所述的方法,其中所述模型是掩码自编码器MAE模型。
3.根据权利要求2所述的方法,其中所述第一帧子集和所述第二帧子集中的每个帧在被输入到所述MAE模型中之前被随机掩码。
4.根据权利要求1所述的方法,其中所述第一帧子集和所述第二帧子集从所述多个帧被随机选择。
5.根据权利要求1所述的方法,其中所述第二帧子集包括两倍于所述第一帧子集的帧。
6.根据权利要求1所述的方法,在提供所述模型之前,还包括:
7.根据权利要求6所述
...【技术特征摘要】
1.一种针对视频处理执行时间渐进式学习的方法,所述方法包括:
2.根据权利要求1所述的方法,其中所述模型是掩码自编码器mae模型。
3.根据权利要求2所述的方法,其中所述第一帧子集和所述第二帧子集中的每个帧在被输入到所述mae模型中之前被随机掩码。
4.根据权利要求1所述的方法,其中所述第一帧子集和所述第二帧子集从所述多个帧被随机选择。
5.根据权利要求1所述的方法,其中所述第二帧子集包括两倍于所述第一帧子集的帧。
6.根据权利要求1所述的方法,在提供所述模型之前,还包括:
7.根据权利要求6所述的方法,其中所述第三帧子集包括两倍于所述第二帧子集的帧。
8.根据权利要求1所述的方法,其中所述提取、所述输入和所述比较的每个序列限定相应的阶段,并且其中针对每个阶段的所述帧子集中所提取的帧的数目是基于阶段的总数目和计算预算而被确定的。
9.一种用于针对视频处理执行时间渐进式学习的系统,所述系统包括:
10.根据权利要求9所述的方法,其中所述模型是掩码自编码器mae模型。
11.根据权利要求10所述的方法,其中所述第一帧子集和所述第二帧子集中的每个帧在被输入到所述mae...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。