一种基于深度学习的多视角动作识别方法和装置制造方法及图纸

技术编号:43676357 阅读:34 留言:0更新日期:2024-12-18 21:00
本发明专利技术公开了一种基于深度学习的多视角动作识别方法及装置,该方法包括:获取包含人体的多视角图像,基于预训练的YOLOv5模型提取图像中的人体位置区域并进行预处理;构建多视角动作识别模型,所述多视角动作识别模型结构包括:多视角感知层、Backbone骨干网络层和输出层;使用经预处理后的数据对所述多视角动作识别模型进行训练;将所述预训练的YOLOv5模型和训练完成的多视角动作识别模型,进行部署;将待处理的图像作为输入,实现人体多视角动作识别。该方法能够有效地克服存在遮挡和视角变化对动作识别的影响,从而提高了动作识别的准确性和鲁棒性;可适用于各种复杂的场景。

【技术实现步骤摘要】

本专利技术涉及深度学习、图像处理、计算机视觉,更具体的说是涉及一种基于深度学习的多视角动作识别方法和装置


技术介绍

1、目前,在现有的动作检测和识别技术中,大多数方法依赖于单视角的视频或图像数据。然而,单视角的数据往往无法提供足够的空间信息,特别是在某些复杂场景下,如多人交互、存在遮挡等情况,动作检测和识别的准确率下降。

2、因此,如何有效地利用多视角数据来提高动作检测和识别的准确性,成为了一个亟待解决的问题。


技术实现思路

1、有鉴于此,本专利技术提供了一种基于深度学习的多视角动作识别方法和装置,该方法通过融合多个视角的视频或图像数据,可以更全面地捕捉到动作的空间特征和形态变化特征,提高动作检测和识别的准确率,可以有效解决复杂场景,如多人交互、存在遮挡,视角变化情况,动作识别准确率下降的问题;可应用于安全生产智能监控等领域。

2、为了实现上述目的,本专利技术采用如下技术方案:

3、第一方面,本专利技术实施例提供一种基于深度学习的多视角动作识别方法,包括以下步骤:

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的多视角动作识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,获取包含人体的多视角图像,基于预训练的YOLOv5模型提取图像中的人体位置区域并进行预处理;包括:

3.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述多视角感知层,作为多视角动作识别模型的输入层,用于感知每个视角的空间特征信息,并提取图像的浅层语义特征;

4.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述Backbone骨干网络层,使用ResNet18作为...

【技术特征摘要】

1.一种基于深度学习的多视角动作识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,获取包含人体的多视角图像,基于预训练的yolov5模型提取图像中的人体位置区域并进行预处理;包括:

3.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述多视角感知层,作为多视角动作识别模型的输入层,用于感知每个视角的空间特征信息,并提取图像的浅层语义特征;

4.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述backbone骨干网络层,使用resnet18作为基础网络结构,用于提取图像深层语义特征;所述resnet18使用basicblock模块构建网络,引入残差连接,并增加一个通道注意力模...

【专利技术属性】
技术研发人员:潘金全王兆均陈正明蔡佳峰
申请(专利权)人:暗物智能科技广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1