本发明专利技术公开了一种基于深度学习的办公场所人员行为轻量级目标检测方法,属于图像检测技术领域。本发明专利技术基于所改进的C3S模块以及FPN模块,可以方便地应用到目标场所的指定的目标对象的检测任务中,且检测任务的精度高、复杂度低。本发明专利技术可以用于对指定的办公场所的人员行为进行检测,将实时监控的目标场所的图像输入到本发明专利技术的目标检测网络模型,基于其输出即可得到对应的检测结果。本发明专利技术可以用于运维场所的目标检测,也可以用于其他业务场景的目标检测,如营业场所监控场景、重要区域安防监控场景、重要设施监控场景等,模型对人员违规行为、场所及设备异常状态的检测能力将进一步得到提升。到提升。到提升。
【技术实现步骤摘要】
基于深度学习的办公场所人员行为轻量级目标检测方法
[0001]本专利技术属于图像检测
,具体涉及一种基于深度学习的办公场所人员行为轻量级目标检测方法。
技术介绍
[0002]目标检测是计算机视觉三大基础问题之一,在自动驾驶、图像/视频检索、视频监控等领域有着重要的应用,目标检测领域的研究具有十分重要的意义。在目标检测领域,可以通过添加或改进组件来优化骨干网络,但是这样也会带来新的计算瓶颈;在实际应用中,因对应的场景不同,实际效果会有波动,往往会更糟。但是,如果对基本构件的改进能够在不影响训练模型的情况下,提高相关适用场景的有效性,那么这种改进因有普遍适用性,会被广泛接受,具有广阔的应用前景。
[0003]目前的目标检测算法主要有两大类,一是两阶段检测算法(Two
‑
Stage),二是单阶段检测算法(One
‑
Stage)。单目标检测算法不需要产生候选区域(Region Proposal)阶段,可以通过一个Stage直接产生物体的类别概率和位置坐标值,比较典型的算法有YOLO、SSD和CornerNet目标检测算法。双阶段目标检测算法将检测问题划分为两个阶段,第一个阶段首先产生候选区域(Region Proposals),包含目标大概的位置信息,然后第二个阶段对候选区域进行分类和位置精修,这类算法的典型代表有R
‑
CNN,Fast R
‑
CNN,Faster R
‑
CNN等。目标检测模型的主要性能指标是检测准确度和速度,其中准确度主要考虑物体的定位以及分类准确度。一般情况下,Two
‑
Stage算法在准确度上有优势,而One
‑
Stage算法在速度上有优势。随着研究和技术的发展,两类算法都进行了改进,均能在准确度以及速度上取得较好的结果。最新的Yolov5单阶段系列算法,具有易于配置环境参数、模型训练速度快,并且批处理推理产生实时结果的优点;还能够直接对单个图像、批处理图像、视频,甚至网络摄像头端口输入进行有效推理。
技术实现思路
[0004]本专利技术提供了一种基于深度学习的办公场所人员行为轻量级目标检测方法,可用于提升对指定工作行为的检测精度和效率。
[0005]本专利技术采用的技术方案为:
[0006]基于深度学习的办公场所人员行为轻量级目标检测方法,该方法包括:
[0007]配置对目标场所的人员行为的检测类别及类别标签;
[0008]设置初始目标检测网络模型,所述初始目标检测网络模型包括骨干网络、特征融合网络和预测网络;
[0009]所述骨干网络用于提取目标场所的采集图像的多尺度特征信息,并将提取的多尺度特征信息输入到特征融合网络;
[0010]所述融合网络,基于骨干网络提取的多尺度特征信息进行组合和融合处理,输出多个尺度的融合特征图,每个尺度的融合特征图对应一种预置的锚框模式(即锚框尺寸);
[0011]所述预测网络,对每一个融合特征图,基于预置的锚框模式,预测该融合特征图中目标检测位置,以及目标类别标签;
[0012]所述骨干网络依次包括:隔行采样拼接模块,多个带交叉卷积的单元模块,一个卷积块和空间金字塔池化模块;
[0013]所述带交叉卷积的单元模块包括三两部分:第一部分为一个卷积块,第二部分为为一个或多个C3S模块的堆叠结构,第三部分为一个或多个残差模块的堆叠结构;所述C3S模块包括两个顺次连接的卷积块,其中,第一个卷积块的卷积层的卷积核为3
×
1,第二卷积块的卷积层的卷积核为1
×
3;所述卷积块依次包括卷积层、批归一化层和激活函数层;
[0014]基于采集的训练数据(目标场所的采集图像)对初始目标检测网络模型进行网络参数学习,得到目标场所的目标检测网络模型。
[0015]进一步的,所述C3S模块的输入和输出之间存在跳跃连接(短连接)。即通过跳跃连接将C3S模块的输入特征图与该C3S模块的第二个卷积块的输出特征图相加,作为该C3S模块的输出特征图。
[0016]进一步的,所述融合网络输出的融合特征图的尺度数与骨干网络包括的带交叉卷积的单元模块数M一致,且输入到融合网络的特征图包括:SPP模块的输出特征图,以及最后M
‑
1个带交叉卷积的单元模块的输出特征图;
[0017]进一步的,所述融合网络包括M
′
(M
′
>1)条支路,其中,第一条支路的输入特征图为SPP模块的输出特征图,包括顺次连接的两个带交叉卷积的单元模块和一个卷积块;
[0018]其余的M
′‑
1条支路的输入依次为上一条支路的最后一个带交叉卷积的单元模块的输出特征图,以及骨干网络中的对应的带交叉卷积的单元模块的输出特征图,融合网络的第2至第M
′
条支路的结构相同,依次包括FPN模块、卷积块、带交叉卷积的单元模块和卷积块;其中,FPN模块包括上采样层、1
×
1卷积层和相加操作层,所述上采样层的输入为当前支路的上一条支路的带交叉卷积的单元模块的输出特征图,1
×
1卷积层的输入为骨干网络中的对应的带交叉卷积的单元模块的输出特征图,所述相加操作层用于对上采样层和1
×
1卷积层的输出特征图相加。
[0019]进一步的,所述骨干网络包括三个带交叉卷积的单元模块;其中,第一个带交叉卷积的单元模块包括一个C3S模块和一个残差模块;第二和第三个带交叉卷积的单元模块相同,均包括一个C3S模块和三个残差模块。
[0020]进一步的,所述融合网络各条支路上的带交叉卷积的单元模块相同,均包括两个C3S模块和一个残差模块。
[0021]进一步的,所述初始目标检测网络模型在网络参数学习时,采用的损失函数为对象损失、分类损失和锚框损失之和。
[0022]进一步的,所述SPP模块的处理为:SPP模块的输入特征图经过1
×
1的卷积层,再经过并列的三个最大池化层进行下采样,将三路下采样结果与SPP模块的输入特征图相加,再经卷积层后恢复到SPP模块的输入特征图的尺寸。
[0023]进一步的,所述预测网络采用目标检测网络YOLO中的预测层。
[0024]本专利技术提供的技术方案至少带来如下有益效果:基于本专利技术所改进的C3S模块以及FPN模块,可以方便地应用到目标场所的指定的目标对象的检测任务中,以实现对目标场所的人员行为进行检测,即将实时监控的目标场所的图像输入到本专利技术的目标检测网络模
型,基于其输出即可得到对应的检测结果。且检测任务的精度高、复杂度低,以检验办公人员行为的合规情况,从而提升服务水平,提高工作效率,
附图说明
[0025]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于深度学习的办公场所人员行为轻量级目标检测方法,其特征在于,包括:配置对目标场所的人员行为的检测类别及类别标签;设置初始目标检测网络模型,所述初始目标检测网络模型包括骨干网络、特征融合网络和预测网络;所述骨干网络用于提取目标场所的采集图像的多尺度特征信息,并将提取的多尺度特征信息输入到特征融合网络,所述融合网络,基于骨干网络提取的多尺度特征信息进行组合和融合处理,输出多个尺度的融合特征图,每个尺度的融合特征图对应一种预置的锚框模式;所述预测网络,对每一个融合特征图,基于预置的锚框模式,预测该融合特征图中目标检测位置,以及目标类别标签;所述骨干网络依次包括:隔行采样拼接模块,多个带交叉卷积的单元模块,一个卷积块和空间金字塔池化模块;所述带交叉卷积的单元模块包括三两部分:第一部分为一个卷积块,第二部分为为一个或多个C3S模块的堆叠结构,第三部分为一个或多个残差模块的堆叠结构;所述C3S模块包括两个顺次连接的卷积块,其中,第一个卷积块的卷积层的卷积核为3
×
1,第二卷积块的卷积层的卷积核为1
×
3;所述卷积块依次包括卷积层、批归一化层和激活函数层;基于采集的训练数据对初始目标检测网络模型进行网络参数学习,得到目标场所的目标检测网络模型。2.如权利要求1所述的方法,其特征在于,所述C3S模块的输入和输出之间存在跳跃连接。3.如权利要求1所述的方法,其特征在于,所述融合网络包括M
′
条支路,M
′
为大于1的正整数;其中,第一条支路的输入特征图为SPP模块的输出特征图,第一条支路包括顺次连接的两个带交叉卷积的单元模块和一个卷积块;其余的M
′‑
1条支路的输入依次为上一条支路的最后一个带交叉卷积的单元模块的输出特征图,以及骨干网络中的对应的带交叉卷积的单元模块的输出特征图;融合网络的第2至第M
...
【专利技术属性】
技术研发人员:薛俊民,饶云波,郭航瑞,杨自强,周望,慕通泽,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。