【技术实现步骤摘要】
一种用于视频行为识别的正则化方法
本申请涉及正则化领域,尤其涉及一种用于视频行为识别的正则化方法。
技术介绍
深度神经网络在许多复杂的机器学习任务中表现出色。但是,由于深度神经网络的体系结构需要大量且丰富的数据和数目庞大的参数,以致在一些情况下,深度神经网络会对有限数据过拟合,使训练好的网络在训练集之外的验证集样本上表现较差。从而导致的机器学习算法的泛化能力和稳定性的降低一直是普遍存在的挑战。过拟合的问题通常发生在参数相对过多的网络训练过程中,这种情况下训练出的网络总能很好地拟合训练数据,损失函数值可能也非常接近于0。但是,这样会导致它无法泛化到新的数据样本中,以至于无法较好预测新样本。为解决这些局限性,许多正则化(Regularization)技术被提出,它们能在很大程度上提升模型的泛化与收敛等性能。正则化技术是机器学习尤其是深度学习的重要组成部分之一,常用于避免参数量相对较大的网络在训练过程中对有限数据产生过拟合现象。正则化旨在降低测试集误差而不是训练集误差,其通过避免训练完美拟合数据样本的系数而增强模型的泛化性 ...
【技术保护点】
1.一种用于视频行为识别的正则化方法,其特征在于,包括以下步骤:/n步骤一:经过时空卷积神经网络提取特征后,得到上一层输出N个时间步的尺寸为H×W×C的特征图,其中H×W为空间尺寸,C为通道数,记所述第i个时间步的特征图为v
【技术特征摘要】
1.一种用于视频行为识别的正则化方法,其特征在于,包括以下步骤:
步骤一:经过时空卷积神经网络提取特征后,得到上一层输出N个时间步的尺寸为H×W×C的特征图,其中H×W为空间尺寸,C为通道数,记所述第i个时间步的特征图为vi,其中i=1,…,N;
步骤二:接着以时间步为单位,利用3D全局平均池化技术得到第i个特征图的显著性分数si,如下式得到:
步骤三:得到N个对应特征图的显著性分数后,利用gESD检验方法进行离群值检测。首先计算检验统计量R:
其中为N个显著性分数的均值;
步骤四:接着计算临界值λ如下:
其中tp,N-2为来自N-2自由度t分布的100p分位点。而p由显著性水平α得到:
然后比较检验统计量R与临界值λ,如果R>λ那么在该批N个特征图中存在显著空间特征图接着执行步骤五,否则不存在接着执行步骤六;
步骤五:在选定显著空间特征图后,为高效丢弃显著空间特征,以通道为最小单元进行2D全局平均池化得到对应通道的显著性分数,并以此为依据为每个通道设置对应丢弃概率,第i个时间步的第c个通道的丢弃概率计算为:
其中,Psal是一个用来保证该特征图所有通道的期望丢弃概率接近Psal的预设超参数,
剩余时间步的特征图中所有通道丢弃概率均设置为Prest,其值小于Psal。
步骤六:若不存在显著空间特征图,则将所有时间步的特征图丢弃概率均设置为Prest,以保证正则化效果在训练全程均在一定程度上生效;
步骤七:随机生成一个与输入特征图时间维度尺寸一致的值域为[0,1]的张量掩膜,与所有通道的丢弃概率相比较,保留张量值大于对应丢弃概率的元素,反之则丢弃,从而产生一个相同尺寸的0-1掩膜;
步骤八:计算...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。