人体动作识别的方法、装置、存储介质和车辆制造方法及图纸

技术编号：36267555 阅读：14 留言：0更新日期：2023-01-07 10:07

本发明专利技术公开了一种人体动作识别的方法、装置、存储介质和车辆，该方法应用于车辆，人体动作识别的方法包括：获取RGB图像和深度图像；对RGB图像和深度图像进行融合处理，得到融合图像；对融合图像进行目标检测，得到检测目标的检测框信息，其中，检测目标包括人体和物体；根据检测框信息和深度图像，得到检测目标的三维坐标信息；对深度图像进行人体骨骼关键点检测，得到人体骨骼关键点的三维坐标信息；根据检测目标的三维坐标信息和人体骨骼关键点的三维坐标信息，识别出人体动作类别。该人体动作识别的方法在正常光和暗光条件下均能够准确检测人体动作类别，并利用人和物体交互建模提高了检测的准确性。提高了检测的准确性。提高了检测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
人体动作识别的方法、装置、存储介质和车辆

[0001]本专利技术涉及车辆
，尤其涉及一种人体动作识别的方法、装置、存储介质和车辆。

技术介绍

[0002]人体动作识别拥有着广泛的应用场景，例如在汽车座舱中，有如行为识别、危险动作检测等应用方向。在舱内环境中，如何利用有限的传感器数量进行准确的姿态识别以及物体检测成为了业界一大难题。
[0003]行为识别(Action Recognition)任务是从视频序列输入中识别不同动作或行为的技术，可以看作对视频序列的分类任务。行为识别方法分传统方法和深度学习方法，传统方法利用传统人工设计的计算机视觉算法对视频进行特征提取，经过处理后用传统的机器学习分类器，例如SVM(Support Vector Machine，支持向量机)，对提取到的特征进行分类得到最终行为识别的结果。基于深度学习的方法有单流法、双流法以及基于骨架的行为识别法。单流法输入连续RGB彩色视频帧，双流法输入一个时间流一个空间流，基于骨架的方法输入人体骨架坐标。
[0004]相关技术中，基于深度学习的方法为主流。例如，在专利《危险动作的识别方法及装置、电子设备和存储介质》CN113486759A中，采用了基于深度学习的单流法，通过车舱内采集的图像数据，对每一帧RGB图像进行行为分类，从而实现对舱内危险行为的识别。在专利《车内人员危险动作识别方法和装置、电子设备、存储介质》CN110399767A中，也采用了基于深度学习的单流法，通过对视频流中的每一帧图像数据进行区域划分，然后通过对特定区域内...

【技术保护点】

【技术特征摘要】
1.一种人体动作识别的方法，其特征在于，所述方法应用于车辆，所述方法包括：获取RGB图像和深度图像；对所述RGB图像和所述深度图像进行融合处理，得到融合图像；对所述融合图像进行目标检测，得到检测目标的检测框信息，其中，所述检测目标包括人体和物体；根据所述检测框信息和所述深度图像，得到所述检测目标的三维坐标信息；对所述深度图像进行人体骨骼关键点检测，得到人体骨骼关键点的三维坐标信息；根据所述检测目标的三维坐标信息和所述人体骨骼关键点的三维坐标信息，识别出人体动作类别。2.根据权利要求1所述的人体动作识别的方法，其特征在于，所述对所述RGB图像和所述深度图像进行融合处理，包括：获取RGB采集设备的内外参数得到第一内外参数，并获取深度相机的内外参数得到第二内外参数；获取所述RGB采集设备与所述深度相机之间的几何位置关系；根据所述第一内外参数、所述第二内外参数和所述几何位置关系，对所述RGB图像和所述深度图像进行融合处理。3.根据权利要求1所述的人体动作识别的方法，其特征在于，所述检测框信息包括所述检测目标的二维坐标信息，所述根据所述检测框信息和所述深度图像，得到所述检测目标的三维坐标信息，包括：获取所述融合图像与所述深度图像之间的对应关系；根据所述检测目标的二维坐标信息和所述对应关系，得到所述检测目标的深度信息；根据所述检测目标的二维坐标信息和深度信息，得到所述检测目标的三维坐标信息。4.根据权利要求1所述的人体动作识别的方法，其特征在于，利用关键点检测模型对所述深度图像进行人体骨骼关键点检测，所述人体骨骼关键点数量为N个，所述关键点检测模型包括N个特征层，所述N个特征层用于回归关键点的深度信息，其中，N为大于1的整数。5.根据权利要求4所述人体动作识别的方法，其特征在于，所述关键点检测模型还包括全连接层，所述N个特征层与所述全连接层相连，所述全连接层用于根据关...

【专利技术属性】
技术研发人员：周畅，
申请(专利权)人：浙江吉利控股集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人