一种基于改进的Densenet模型的课堂行为识别分类方法及系统技术方案

技术编号:33551570 阅读:18 留言:0更新日期:2022-05-26 22:47
本发明专利技术公开一种基于改进的Densenet模型的课堂行为识别分类方法及系统,包括:通过摄像机采集课堂行为图像数据,构建课堂行为数据库;在Densenet模型中增加StemBlock模块,得到第一Densenet模型;在第一Densenet模型中增加通道注意模块,得到第二Densenet模型;将课堂行为数据库中的行为图像数据输入至改进后的网络模型即为第二Densenet模型,对课堂行为进行识别分类。本发明专利技术对已有数据集进行训练,可以提取图像的深层特征,从而获得更丰富的图像信息,使用StemBlock模块,可以在不带来过多计算耗时的前提下,提高网络的特征表达能力。在两个DenseBlock之间加入自注意力机制,可以使网络更加关注图像的重要特征区域,不会丢失样本的重要信息,从而使得特征提取更加高效,之后更好的做分类。后更好的做分类。后更好的做分类。

【技术实现步骤摘要】
一种基于改进的Densenet模型的课堂行为识别分类方法及系统


[0001]本专利技术涉及课堂行为识别分类
,特别是涉及一种基于改进的Densenet模型的课堂行为识别分类方法及系统。

技术介绍

[0002]在课堂教学活动中,学生作为学习活动的主体,其行为状态是教学活动的直接体现,而课堂行为识别一直是教育领域的研究重点和难点。因此,学生课堂行为分析既是教学分析的重要环节,也是影响学生学习和教师教学效率的重要因素。当前,要求对学生课堂行为分析提出了更高的要求,通过学生的行为判断学生学习状态,进而形成教学反馈,但这种方式耗时费力,不能满足当今智慧学习环境下大规模课堂分析需求。实现智能化的学生课堂行为识别变得越来重要。
[0003]近年来,随着人工智能和计算机视觉等技术的发展,以及各种教室录播设备的使用,国内开始出现一些利用计算机视觉和人工智能等技术来实现学生课堂行为识别的研究。如:在教室场景下利用Kinect设备提取人体骨骼特征向量,然后再用SVM分类器对特征向量进行分类和识别学生的姿态和行为。此方法实现了人体骨骼特征和传统机器学习的结合,但使用的是传统机器学习的方法,还需要在教室里架设专门的Kinect设备采集数据,操作较复杂且准确率不高,现有技术中的图像分类识别虽然可以实现,但也具有一定的局限性,对于课堂行为图像,图像中的背景较为复杂、人员较多、特征提取较为困难。因此需要提供一种对课堂行为识别率高的行为识别分类方法。

技术实现思路

[0004]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于改进的Densenet模型的课堂行为识别分类方法及系统,用于解决现有技术中的具有一定的局限性,对于课堂行为图像,图像中的背景较为复杂、人员较多、特征提取较为困难的问题。
[0005]为实现上述目的及其他相关目的,本专利技术提供一种基于改进的Densenet模型的课堂行为识别分类方法,包括:
[0006]S1、通过摄像机采集课堂行为图像数据,构建课堂行为数据库;
[0007]S2、在Densenet模型中增加Stem Block模块,得到第一Densenet模型;
[0008]S3、在第一Densenet模型中增加通道注意模块,得到第二Densenet模型;
[0009]S4、将课堂行为数据库中的行为图像数据输入至改进后的网络模型即为第二Densenet模型,对课堂行为进行识别分类。
[0010]在本专利技术的一实施例中,所述课堂行为数据库包括举手行为数据、睡觉行为数据、左顾右盼行为数据。
[0011]在本专利技术的一实施例中,所述步骤S2中的在Densenet模型中增加Stem Block模块,得到第一Densenet模型包括:
[0012]将Stem Block模块替代Densenet模型中的7
×
7卷积以及3
×
3最大池化;
[0013]所述Densenet模型的卷积核在二维图像上采用的是二维的离散卷积,其计算公式为:
[0014][0015]其中,I(x,y)表示特征图在位置(x,y)上的值,k(x,y)表示m
×
n维的卷积核,某一层卷积核的输入特征图尺寸为M
×
N,卷积核尺寸为k
×
k,填充为t,步长为s;
[0016]利用深度为32、步长为2的3
×
3卷积接收行为图像数据,进行提取特征操作,再分为两个并行操作,其中一个并行操作为先进行深度为16、步长为1的1
×
1卷积操作,再进行深度为32、步长为2的3
×
3卷积操作;另一个并行操作为进行步长为2的2
×
2卷积的最大值池化操作,最后将两个并行操作的输出拼接输入至深度为32、步长为1的1
×
1的卷积。
[0017]在本专利技术的一实施例中,所述步骤S3中的在第一Densenet模型中增加通道注意模块,得到第二Densenet模型包括:
[0018]实现对通道注意模块中的通道进行选择,公式为:
[0019][0020]其中,σ为sigmoid函数,F表示原特征图,Avgpool(F)为平均池化,MaxPool(F)为最大池化,和表示平均池化特征和最大池化特征,M
c
(F)为产生的通道注意力图,MLP为共享网络由一个多层感知器组成,包括一个隐含层;
[0021]分别计算每张特征图的全局平均池化及全局最大池化信息,再通过全连接层后相加来得到通道注意力参数,其中两者共用相同的全连接网络,M
c
(F)与F进行元素相乘得到F

,其中,为元素乘法,F

为计算得到的通道注意图。
[0022]本专利技术还提供一种基于改进的Densenet模型的课堂行为识别分类系统,包括:
[0023]摄像机,用于采集课堂行为图像数据,构建课堂行为数据库;
[0024]Stem Block模块增加单元,用于在Densenet模型中增加Stem Block模块,得到第一Densenet模型;
[0025]通道注意模块增加单元,用于在第一Densenet模型中增加通道注意模块,得到第二Densenet模型;
[0026]输入单元,用于将课堂行为数据库中的行为图像数据输入至改进后的网络模型即为第二Densenet模型,对课堂行为进行识别分类。
[0027]本专利技术还提供一种电子设备,包括处理器和存储器,所述存储器存储有程序指令,所述处理器运行程序指令实现上述的基于改进的Densenet模型的课堂行为识别分类方法。
[0028]如上所述,本专利技术的一种基于改进的Densenet模型的课堂行为识别分类方法及系统,具有以下有益效果:
[0029]本专利技术的基于改进的Densenet模型的课堂行为识别分类方法利用深度学习模型Densenet对已有数据集进行训练,可以提取图像的深层特征,从而获得更丰富的图像信息,使用Stem Block模块,可以在不带来过多计算耗时的前提下,提高网络的特征表达能力。在
两个Dense Block之间加入自注意力机制,可以使网络更加关注图像的重要特征区域,不会丢失样本的重要信息,从而使得特征提取更加高效,之后更好的做分类。
附图说明
[0030]图1为本申请实施例提供的基于改进的Densenet模型的课堂行为识别分类方法的工作流程图。
[0031]图2为本申请实施例提供的基于改进的Densenet模型的课堂行为识别分类方法的Stem Block结构图。
[0032]图3为本申请实施例提供的基于改进的Densenet模型的课堂行为识别分类方法的改进后的Densenet网络结构图。
[0033]图4为本申请实施例提供的基于改进的Densenet模型的课堂行为识别分类方法的添加的通道注意力模块。
具体实施方式
[0034]以下通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的Densenet模型的课堂行为识别分类方法,其特征在于,包括:S1、通过摄像机采集课堂行为图像数据,构建课堂行为数据库;S2、在Densenet模型中增加Stem Block模块,得到第一Densenet模型;S3、在第一Densenet模型中增加通道注意模块,得到第二Densenet模型;S4、将课堂行为数据库中的行为图像数据输入至改进后的网络模型即为第二Densenet模型,对课堂行为进行识别分类。2.根据权利要求1所述的一种基于改进的Densenet模型的课堂行为识别分类方法,其特征在于:所述课堂行为数据库包括举手行为数据、睡觉行为数据、左顾右盼行为数据。3.根据权利要求2所述的一种基于改进的Densenet模型的课堂行为识别分类方法,其特征在于,所述步骤S2中的在Densenet模型中增加Stem Block模块,得到第一Densenet模型包括:将Stem Block模块替代Densenet模型中的7
×
7卷积以及3
×
3最大池化;所述Densenet模型的卷积核在二维图像上采用的是二维的离散卷积,其计算公式为:其中,I(x,y)表示特征图在位置(x,y)上的值,k(x,y)表示m
×
n维的卷积核,某一层卷积核的输入特征图尺寸为M
×
N,卷积核尺寸为k
×
k,填充为t,步长为s;利用深度为32、步长为2的3
×
3卷积接收行为图像数据,进行提取特征操作,再分为两个并行操作,其中一个并行操作为先进行深度为16、步长为1的1
×
1卷积操作,再进行深度为32、步长为2的3
×
3卷积操作;另一个并行操作为进行步长为2的2
×
...

【专利技术属性】
技术研发人员:邹孝龙丁绪星任悦悦钱强周学顶
申请(专利权)人:安徽师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1