【技术实现步骤摘要】
本专利技术涉及深度学习、图像处理、计算机视觉,更具体的说是涉及一种基于深度学习的多视角动作识别方法和装置。
技术介绍
1、目前,在现有的动作检测和识别技术中,大多数方法依赖于单视角的视频或图像数据。然而,单视角的数据往往无法提供足够的空间信息,特别是在某些复杂场景下,如多人交互、存在遮挡等情况,动作检测和识别的准确率下降。
2、因此,如何有效地利用多视角数据来提高动作检测和识别的准确性,成为了一个亟待解决的问题。
技术实现思路
1、有鉴于此,本专利技术提供了一种基于深度学习的多视角动作识别方法和装置,该方法通过融合多个视角的视频或图像数据,可以更全面地捕捉到动作的空间特征和形态变化特征,提高动作检测和识别的准确率,可以有效解决复杂场景,如多人交互、存在遮挡,视角变化情况,动作识别准确率下降的问题;可应用于安全生产智能监控等领域。
2、为了实现上述目的,本专利技术采用如下技术方案:
3、第一方面,本专利技术实施例提供一种基于深度学习的多视角动作识别方法,包
本文档来自技高网...【技术保护点】
1.一种基于深度学习的多视角动作识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,获取包含人体的多视角图像,基于预训练的YOLOv5模型提取图像中的人体位置区域并进行预处理;包括:
3.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述多视角感知层,作为多视角动作识别模型的输入层,用于感知每个视角的空间特征信息,并提取图像的浅层语义特征;
4.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述Backbone骨干网络层,使用
...【技术特征摘要】
1.一种基于深度学习的多视角动作识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,获取包含人体的多视角图像,基于预训练的yolov5模型提取图像中的人体位置区域并进行预处理;包括:
3.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述多视角感知层,作为多视角动作识别模型的输入层,用于感知每个视角的空间特征信息,并提取图像的浅层语义特征;
4.根据权利要求1所述的一种基于深度学习的多视角动作识别方法,其特征在于,所述backbone骨干网络层,使用resnet18作为基础网络结构,用于提取图像深层语义特征;所述resnet18使用basicblock模块构建网络,引入残差连接,并增加一个通道注意力模...
【专利技术属性】
技术研发人员:潘金全,王兆均,陈正明,蔡佳峰,
申请(专利权)人:暗物智能科技广州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。