【技术实现步骤摘要】
一种用于具有长尾分布特性的单猴视频动作分类方法
[0001]本专利技术涉及计算机视觉
,具体涉及一种用于具有长尾分布特性的单猴视频动作分类方法。
技术介绍
[0002]自然界中各种真实的数据通常呈现出不平衡的长尾分布的形态,比如本数据集中猴子蹲坐的频次很高,而向上跳跃和向下跳跃的频次则很低。自然场景中只有少部分类别有大量样本,而其余大本部类别只有少量样本。类别的极度不平衡给深度学习和视觉识别带来极大的挑战,导致基于数据的模型学习被“头部”即样本数量多的类别主导而过拟合,而“尾部”即样本数量少的类别欠拟合,模型结果欠佳且泛化能力很差。因此,解决长尾分布数据的不平衡问题有重要应用前景。
[0003]目前主要解决长尾分布不平衡问题的方法主要包括三类:(1)数据重采样,通过“尾部”类别的过采样或“头部”类别的欠采样人工平衡数据后再进行训练学习。(2)类平衡损失,通过给不同类别设定不同的损失函数或设计特别的损失函数解决数据不平衡问题。(3)迁移学习,将在“头部”学习到的特征迁移到“尾部”。现有方法多是针对图像分类,还未有 ...
【技术保护点】
【技术特征摘要】
1.一种用于具有长尾分布特性的单猴视频动作分类方法,其特征在于,所述单猴视频动作分类方法包括以下步骤:步骤1,构建猴子的动作数据集;步骤2,通过数据集对深度神经网络进行训练,构建单猴视频动作分类模型;步骤3:对模型进行评估,判定模型的稳定性和泛化能力;步骤4:分析分类效果,如果效果不理想可以回到步骤2中进一步训练以得到性能更好的模型;在步骤S2中,还包括以下步骤:步骤21,输入符合长尾分布的动作数据集,不进行类平衡采样,直接输入深度神经网络训练进行特征提取;步骤22,深度神经网络通过线性分类器进行分类;步骤23,对分类器的参数进行归一化得到最终的分类模型。2.根据如权利要求1所述单猴视频动作分类方法,其特征在于,在步骤1中,所述动作数据集中第i个数据为X
i
={x
i
,y
i
},其中,x
i
为第i个视频,y
i
为第i个视频的标签即类别,记n
k
为第k类视频的个数,是所有类别视频的总数。3.根据如权利要求1所述单猴视频动作分类方法,其特征在于,在步骤S21中,所述特征为:f(x;θ)=z其中x为输入的视频数据,θ为深度神经网络参数,z为提取的特征向量。4.根据如权利要求3所述单猴视频动作分类方法,其特征在于,在步骤S22中,所述线性分类器为:g(z)=W
...
【专利技术属性】
技术研发人员:朱磊,范文萱,
申请(专利权)人:北京信智文科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。