多人行为识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：35650099 阅读：12 留言：0更新日期：2022-11-19 16:44

本发明专利技术实施例公开了一种多人行为识别方法、装置、计算机设备及存储介质，其中方法包括：获取检测区域内的图像数据；对图像数据进行切帧处理，以得到多帧静态图片；将多帧静态图片以图片序列的形式输入至人体行为预测模型中进行处理，以得到人体行为识别结果。本发明专利技术结合了多目标跟踪、关键点检测以及光流估计方法，可以有效的对多目标移动的人体进行实时行为识别，对较短时间段内大幅移动人体的行为检测有很好的兼容性，提高了模型在不同场景识别的鲁棒性以及准确性，使得模型对于复杂内容的图像有较好的理解能力。的图像有较好的理解能力。的图像有较好的理解能力。

全部详细技术资料下载

【技术实现步骤摘要】
多人行为识别方法、装置、计算机设备及存储介质

[0001]本专利技术涉及计算机视觉
，更具体地说是一种多人行为识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着社会快速发展，人体行为预测是目前工业界和学界的一个研究热点和难点，其在实际生活中有重要应用价值。针对人体行为预测目前有以下几种方式：
[0003]第一种是首先对采集的可见光图像及红外图像进行图像处理得到跟踪目标区域，接着检测待跟踪目标区域是否包括行人，当包含行人的时候对行人进行跟踪，并在跟踪的过程中检测行人边缘以从待跟踪目标区域获得行人待识别区域，将行人待识别区域输入到识别模型得到行人行为识别结果。该专利基于红外的方式对目标进行跟踪，设备需要额外的花费，且基于传统的方向梯度直方图的方式对图像进行特征提取来判断行人目标，受光照影响严重，效果较差，且该方法仅仅基于人物外观轮廓进行行为识别忽略了空间时间融合信息，识别效果较差。
[0004]第二种是通过运用多任务深度学习的方法训练3D卷积神经网络，将多种人体行为属性以背景视频的固定连续帧数的帧快作为网络的输入，经过3D卷积神经网络训练后完成识别任务。该方法仅仅对固定位置的人体行为进行识别，且仅针对单个人进行行为识别，有很大的局限性。此外，基于3D卷积进行行为识别，模型效率较低，训练的模型容易受背景因素的影响严重，导致识别效果差。
[0005]第三种是通过获取视频片段，对视频片段中的图像帧序列进行特征提取以及降维处理，然后对降维后的特征向量进行编码，将降维特征向量进行扩充，...

【技术保护点】

【技术特征摘要】
1.多人行为识别方法，其特征在于，包括：获取检测区域内的图像数据；对图像数据进行切帧处理，以得到多帧静态图片；将多帧静态图片以图片序列的形式输入至人体行为预测模型中进行处理，以得到人体行为识别结果。2.根据权利要求1所述的多人行为识别方法，其特征在于，所述将多帧静态图片以图片序列的形式输入至人体行为预测模型中进行处理，以得到人体行为识别结果，包括：将多帧静态图片以图片序列的形式输入至跟踪模型进行处理，以得到带有id索引的人物图像；将带有id索引的不同人物图像输入至关键点检测模型进行处理，以得到关键点热力图；将带有id索引的人物图像输入至光流模型中进行处理，以得到光流特征图；将关键点热力图和光流特征图输入至视频分类模型中进行处理，以得到人体行为识别结果。3.根据权利要求2所述的多人行为识别方法，其特征在于，所述将带有id索引的不同人物图像输入至关键点检测模型进行处理，以得到关键点热力图，包括：将带有id索引的不同人物图像输入到多个串联的ExtrackBlock中进行处理，以得到人物特征；将人物特征进行输入到RefineBlock进行处理，以得到关键点热力图。4.根据权利要求3所述的多人行为识别方法，其特征在于，所述将带有id索引的不同人物图像输入到多个串联的ExtrackBlock中进行处理，以得到人物特征，包括：将带有id索引的不同人物图像分别进行深度可分离卷积和空间可分离卷积处理，以得到深度卷积特征和空间卷积特征；将深度卷积特征和空间卷积特征进行相加处理，以得到相加结果特征；将相加结果特征分别通过第一卷积、第二卷积、第三卷积和第四卷积进行处理，以得到第一卷积特征、第二卷积特征、第三卷积特征和第四卷积特征；将第一卷积特征、第二卷积特征、第三卷积特征和第四卷积特征分别输入到4个注意力机制分支中进行处理，以分别得到第一注意力分支特征、第二注意力分支特征、第三注意力分支特征和第四注意力分支特征；将第一注意力分支特征、第二注意力分支特征、第三注意力分支特征和第四注意力分支特征进行concat处理，以得到结合特征；将结合特征与空间卷积特征进行合并，以得到人物特征。5.根据权利要求3所述的多人行为识别方法，其特征在于，所述将人物特征进行输入到RefineBlock进行处理，以得到关键点热力图，包括：将人物特征通过可变形卷积处理，以得到可变形卷积特征；将可变形卷积特征输入至SCSE中进行处理，以得到注意力权重特征；将可变形卷积特征输入到混合深度卷积网络并连接sigmoid层进行处理，以得到注意力特征图；将注意力权重特征与注意力特征图进行相乘处理后得到的结果与可变形卷积特征进
行相加处理，以得到输出特征；将输出特征通过双线性插值放大到原始尺寸，以得到关键点热力图。6.根据权利要求2所述的多人行为识别方法，其特征在于，所述将带有id索引的人物图像输入至光流模型中进行处理，以得到光流特征图，包括：将前后两帧带有id索引的人物图像输入到残差卷积进行处理，以得到第一残差卷积特征和第二残差卷积特征；将第一残差卷积特征和第二残差卷积特征分别输入...

【专利技术属性】
技术研发人员：胡懋成，王秋阳，周婧雯，汪玉冰，郑博超，凤阳，
申请(专利权)人：深圳市赛为智能股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人