一种基于3D卷积参数重构的快速猴子行为识别方法技术

技术编号:35470872 阅读:12 留言:0更新日期:2022-11-05 16:16
本申请公开了一种基于3D卷积参数重构的快速猴子行为识别方法,包括:根据待识别猴子动作的分类结果搭建多分支稀疏模块;搭建基于全连接神经网络的识别模块,并将多分支稀疏模块的输出端与识别模块的输入端进行串联,组成第一识别网络;对第一识别网络进行训练,当判定第一识别网络收敛时,采用空白处填充0值的方式,对多分支稀疏模块中各支路内的卷积核进行扩充,将各支路中同一层的卷积核按位相加,生成单分支稀疏模块;将单分支稀疏模块的输出端与识别模块的输入端进行串联,组成第二识别网络。通过本申请中的技术方案,在不降低识别准确率的情况下大幅提升了猴子动作识别速度,满足猴子药物实验的实时性需求。满足猴子药物实验的实时性需求。满足猴子药物实验的实时性需求。

【技术实现步骤摘要】
一种基于3D卷积参数重构的快速猴子行为识别方法


[0001]本申请涉及计算机视觉和行为识别的
,具体而言,涉及一种基于3D卷积参数重构的快速猴子行为识别方法。

技术介绍

[0002]随着计算机科技的发展,基于计算机视觉技术的自动行为识别方法已经被广泛地应用到了生活中,如监控视频分析、行为捕捉、虚拟现实等。但是,大部分行为识别技术的主要目标是人类,对猴子行为识别的研究较少,而猴子作为药物实验的一种模式动物,在药物安全性评估方面有着重要的作用。
[0003]由于人类行为具有一定的规律性且动作较慢、幅度较小,通常采用24帧到30帧的视频采集设备进行图像采集,利用深层卷积、多支路、注意力机制等策略即可在人类行为数据集上取得较好的动作识别效果。
[0004]但是,猴子的行为较快、幅度较大且不具有与人类类似的规律性,需要使用高帧率的视频采集设备才能清晰采集。然而,视频帧率的提高会使同样长度的视频中包含的帧图像的数量变多,从而导致网络识别行为时需要读取更多的图像,不可避免地会减慢行为识别速度,导致不能满足药物实验的时效性要求。

技术实现思路

[0005]本申请的目的在于:如何在不降低识别准确率的情况下大幅提升猴子动作识别速度,满足猴子药物实验的实时性需求。
[0006]本申请的技术方案是:提供了一种基于3D卷积参数重构的快速猴子行为识别方法,该方法包括:步骤1,对待识别猴子动作进行分类,并根据分类结果搭建多分支稀疏模块,其中,多分支稀疏模块中设置有多个卷积核大小不同的支路;步骤2,搭建基于全连接神经网络的识别模块,并将多分支稀疏模块的输出端与识别模块的输入端进行串联,组成第一识别网络;步骤3,根据猴子行为训练集,对第一识别网络进行训练,当判定第一识别网络收敛时,执行步骤4;步骤4,采用空白处填充0值的方式,对多分支稀疏模块中各支路内的卷积核进行扩充,将各支路中同一层的卷积核按位相加,生成单分支稀疏模块;步骤5,将单分支稀疏模块的输出端与识别模块的输入端进行串联,组成第二识别网络,第二识别网络用于猴子行为识别。
[0007]上述任一项技术方案中,进一步地,待识别猴子动作的分类结果至少包括剧烈行为、第一细微行为以及第二细微行为,其中,第一细微行为的时间跨度大于第二细微行为。
[0008]上述任一项技术方案中,进一步地,多分支稀疏模块由两个结构相同的子模块串联而成,子模块具体包括:剧烈行为支路,第一细微行为支路,第二细微行为支路以及拼接模块;剧烈行为支路由第一卷积核与第二卷积核串联组成,其中,第一卷积核的大小为5
×5×
5,第二卷积核的大小为3
×3×
3;第一细微行为支路由第三卷积核与第四卷积核串联组成,其中,第三卷积核的大小为1
×1×
1,第四卷积核的大小为5
×5×
5;第二细微行为支路
由第五卷积核与第六卷积核串联组成,其中,第五卷积核的大小为1
×1×
1,第六卷积核的大小为3
×3×
3;拼接模块连接于剧烈行为支路、第一细微行为支路以及第二细微行为支路的输出端,拼接模块用于在通道维度上进行特征拼接。
[0009]上述任一项技术方案中,进一步地,步骤3中,对第一识别网络进行训练,具体包括:步骤31,将猴子行为训练集输入至第一识别网络,由识别模块输出预测标签以及预测标签为正类的概率;步骤32,根据预设损失函数与预测标签为正类的概率,计算预测标签与猴子行为训练集中相应标签的损失值;步骤33,根据损失值,采用梯度下降法,优化第一识别网络中的网络参数,直至损失值小于预设数值,判定第一识别网络收敛。
[0010]上述任一项技术方案中,进一步地,预设损失函数的计算公式为:
[0011][0012]式中,l为损失值,N为猴子行为训练集中的样本个数,为第i个样本第j种行为的标签值,i=1,2,

,N,为第i个样本第j种行为预测为正类的概率。
[0013]本申请的有益效果是:
[0014]本申请中的技术方案,根据猴子动作的特点采用不同大小的卷积核搭建多分支稀疏模块,并与识别模块组成第一识别网络,已识别猴子的剧烈行为和不同的细微行为。待网络收敛后采用空白处填充0值的方式,对多分支稀疏模块中各支路内的卷积核进行扩充,并按位相加,生成单分支稀疏模块,以便于收敛后的识别模块组成第二识别网络,在不降低识别准确率的情况下大幅提升猴子动作识别速度,满足猴子药物实验的实时性需求。具体技术效果如下:
[0015](1)在训练阶段通过高性能的多分支稀疏模块学习猴子动作特征,保证了网络的识别性能;
[0016](2)利用多分支稀疏模块与单分支稀疏模块的恒等变换,在不损失性能的情况下充分利用了单分支稀疏模块速度快、占用资源少的特点,大幅节省了部署网络的设备成本与执行行为识别的时间成本,满足了药物评估的时效性、实时性要求;
[0017](3)转换后的单分支稀疏模块与原始的检测模块能够对接,不用重新搭建检测模块进行训练,减少了网络训练所需要的时间成本。
附图说明
[0018]本申请的上述和/或附加方面的优点在结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0019]图1是根据本申请的一个实施例的基于3D卷积参数重构的快速猴子行为识别方法的示意流程图;
[0020]图2是根据本申请的一个实施例的猴子行为视频标注示意图;
[0021]图3是根据本申请的一个实施例的多分支稀疏模块结构示意图;
[0022]图4是根据本申请的一个实施例的识别模块结构示意图;
[0023]图5是根据本申请的一个实施例的多分支与单分支稀疏模块恒等变换示意图;
[0024]图6是根据本申请的一个实施例的场景示意图。
具体实施方式
[0025]为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互结合。
[0026]在下面的描述中,阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。
[0027]如图1所示,本实施例提供了一种基于3D卷积参数重构的快速猴子行为识别方法,该方法包括:
[0028]步骤1,对待识别猴子动作进行分类,并根据分类结果搭建多分支稀疏模块,其中,多分支稀疏模块中设置有多个卷积核大小不同的支路;其中,待识别猴子动作的分类结果至少包括剧烈行为、第一细微行为以及第二细微行为,其中,第一细微行为的时间跨度大于第二细微行为。
[0029]具体的,确定任务后分析、确定场景需求,在猴笼上搭建相机装置,开始采集猴笼中猴子动作的相关视频,并对采集的视频进行筛选和标注,如图2所示,记作猴子行为训练集。并根据预设的比例,将经过筛选和标注的视频进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于3D卷积参数重构的快速猴子行为识别方法,其特征在于,所述方法包括:步骤1,对待识别猴子动作进行分类,并根据分类结果搭建多分支稀疏模块,其中,所述多分支稀疏模块中设置有多个卷积核大小不同的支路;步骤2,搭建基于全连接神经网络的识别模块,并将所述多分支稀疏模块的输出端与所述识别模块的输入端进行串联,组成第一识别网络;步骤3,根据猴子行为训练集,对所述第一识别网络进行训练,当判定所述第一识别网络收敛时,执行步骤4;步骤4,采用空白处填充0值的方式,对所述多分支稀疏模块中各支路内的卷积核进行扩充,将各支路中同一层的卷积核按位相加,生成单分支稀疏模块;步骤5,将所述单分支稀疏模块的输出端与所述识别模块的输入端进行串联,组成第二识别网络,所述第二识别网络用于猴子行为识别。2.如权利要求1所述的基于3D卷积参数重构的快速猴子行为识别方法,其特征在于,所述待识别猴子动作的分类结果至少包括剧烈行为、第一细微行为以及第二细微行为,其中,所述第一细微行为的时间跨度大于所述第二细微行为。3.如权利要求1或2所述的基于3D卷积参数重构的快速猴子行为识别方法,其特征在于,所述多分支稀疏模块由两个结构相同的子模块串联而成,所述子模块具体包括:剧烈行为支路,第一细微行为支路,第二细微行为支路以及拼接模块;所述剧烈行为支路由第一卷积核与第二卷积核串联组成,其中,所述第一卷积核的大小为5
×5×
5,所述第二卷积核的大小为3
×3×
3;所述...

【专利技术属性】
技术研发人员:左从林高大鹏张素才彭霞
申请(专利权)人:北京昭衍新药研究中心股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1