手势识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：30442465 阅读：62 留言：0更新日期：2021-10-24 18:31

本申请提供一种手势识别方法、装置、电子设备及可读存储介质，该手势识别方法包括：获取待识别对象的图像数据；利用预先训练的深度学习检测模型，对所述待识别对象的图像数据进行目标检测，确定手掌区域；利用预先训练的深度学习分类模型，对所述手掌区域进行分类，得到手势识别结果。该方法可以。该方法可以。该方法可以。

全部详细技术资料下载

【技术实现步骤摘要】
手势识别方法、装置、电子设备及可读存储介质

[0001]本申请涉及计算机视觉和人机交互领域，尤其涉及一种手势识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着人工智能的发展和国家对于下一代人工智能的号召，智能车辆已经成为世界车辆工程领域研究的热点和汽车工业增长的新动力。智能不仅体现在自动泊车、自动驾驶等全自动领域，也体现在智能交互、智能控制等方面，需要将汽车打造成另一个舒适、便捷、智能的港湾。
[0003]手势识别是智能车辆实现智能交互、智能控制的关键技术之一，如何准确实现手势识别称为一个亟待解决的技术问题。

技术实现思路

[0004]有鉴于此，本申请提供一种手势识别方法、装置、电子设备及可读存储介质。
[0005]具体地，本申请是通过如下技术方案实现的：
[0006]根据本申请实施例的第一方面，提供一种手势识别方法，包括：
[0007]获取待识别对象的图像数据；
[0008]利用预先训练的深度学习检测模型，对所述待识别对象的图像数据进行目标检测，确定手掌区域；
[0009]利用预先训练的深度学习分类模型，对所述手掌区域进行分类，得到手势识别结果；其中，所述深度学习分类模型在训练过程中，依据类别关联损失函数进行反馈优化，从第S轮训练开始，对于任一训练样本，在利用所述深度学习分类模型得到的预测结果与该训练样本的标注不一致的情况下，该预测结果与标注相似度越高，依据所述类别关联损失函数得到的损失值越大，S为自然数。
[0010]根据本...

【技术保护点】

【技术特征摘要】
1.一种手势识别方法，其特征在于，包括：获取待识别对象的图像数据；利用预先训练的深度学习检测模型，对所述待识别对象的图像数据进行目标检测，确定手掌区域；利用预先训练的深度学习分类模型，对所述手掌区域进行分类，得到手势识别结果；其中，所述深度学习分类模型在训练过程中，依据类别关联损失函数进行反馈优化，从第S轮训练开始，对于任一训练样本，在利用所述深度学习分类模型得到的预测结果与该训练样本的标注不一致的情况下，该预测结果与标注相似度越高，依据所述类别关联损失函数得到的损失值越大，S为自然数。2.根据权利要求1所述的方法，其特征在于，S＞1，且在训练样本的预测结果与该训练样本的标注不一致的情况下，随着训练轮数的增加，依据所述类别关联损失函数得到的损失值分段递增。3.根据权利要求1所述的方法，其特征在于，所述深度学习检测模型包括静态手势分类模型和动态手势分类模型；所述利用预先训练的深度学习分类模型，对所述手掌区域进行分类，得到手势识别结果，包括：对于当前帧图像，利用所述预先训练的静态手势分类模型，对该帧图像的手掌区域进行静态手势识别，得到静态手势识别结果；所述方法还包括：依据所述当前帧图像以及所述当前帧图像的历史帧图像，利用所述预先训练的动态手势分类模型，进行动态手势识别，得到动态手势识别结果；依据所述静态手势识别结果和动态手势识别结果，确定最终的手势识别结果。4.根据权利要求3所述的方法，其特征在于，所述动态手势分类模型的训练流程包括：利用所述动态手势分类模型，得到N1帧训练样本的卷积层特征；其中，N1为大于1的自然数；对所述N1帧训练样本的卷积层特征进行特征移位，得到所述N1帧训练样本的融合特征；依据所述N1帧训练样本的融合特征对所述动态手势分类模型进行训练。5.根据权利要求3所述的方法，其特征在于，所述动态手势分类模型的训练流程包括：将包括N2帧的视频段划分为K部分，得到K个子视频段；N2＞K，N2与K均为大于2的自然数；依次从所述K个子视频段中选取一帧视频图像，得到K帧训练样本；依据所述K帧训练样本对所述动态手势分类模型进行训练。6.根据权利要求3所述的方法，其特征在于，所述依据所述静态手势识别结果和动态手势识别结果，确定最终的手势识别结果，包括：当所述静态手势识别结果与所述动态手势识别结果一致时，将所述静态手势识别结果确定为最终的手势识别结果；当所述静态手势识别结果与所述动态手势识别结果不一致时，依据预设手势关系状态机，确定所述静态手势识别结果与所述动态手势识别结果之间是否允许转换；所述预设手
势关系状态机用于指示静态手势识别结果与动态手势结果之间是否允许转换；若允许转换，则将所述动态手势识别结果确定为最终的手势识别结果；若不允许转换，则确定最终的手势识别结果待定。7.根据权利要求1所述的方法，其特征在于，所述利用预先训练的深度学习分类模型，对所述手掌区域进行分类，得到手势识别结果，包括：依据当前帧图像的手势识别结果，确定以当前时间为结束时间的预设时间段内，手势识别结果与所述当前帧图像的手势识别结果一致，且置信度超过第一预设置信度阈值的图像帧占比；当所述占比超过预设比例阈值时，确定需要输出所述当前帧图像的手势识别结果；当所述占比未超过所述预设比例阈值时，确定不需要输出所述当前帧图像的手势识别结果。8.根据权利要求1
‑
7任一项所述的方法，其特征在于，所述待识别对象为车辆驾驶员，用于获取所述待识别对象的图像数据的图像采集设备部署于车辆方向盘下方；所述方法还包括：对于当前帧图像，利用预先训练的方向盘分割模型，对所述当前帧图像进行方向盘分割，得到所述当前图像帧中方向盘区域；依据所述当前帧图像中方向盘区域，以及手掌区域，确定所述当前帧图像中方向盘区域与手掌区域之间是否存在交集；若所述当前帧图像中方向盘区域与手掌区域之间存在交集，则确定所述当前帧图像的手势识别结果不可信。9.根据权利要求8所述的方法，其特征在于，若所述当前帧图像中方向盘区域与手掌区域之间存在交集，则在确定所述当前帧图像的手势识别结果不可信之前，还包括：确定所述当前帧图像的手势识别结果的置信度是否超过预设置信度阈值；若所述当前帧图像的手势识别结果的置信度超过预设置信度阈值，则确定所述当前帧图像中方向盘区域是否穿过所述当前帧图像中的手掌区域；若穿过，则确定执行所述确定所述当前帧图像的手势识别结果不可信的操作；若未穿过，则确定所述当前帧图像的手势识别结果可信；若所述当前帧图像的手势识别结果的置信度未超过第二预设置信度阈值，则确定执行所述确定所述当前帧图像的手势识别结果不可信的操作。10.一种手势识别装置，其特征在于，包括：获取单元，用于获取待识别对象的图像数据；目标检测单元，用于利用预先训练的深度学习检测模...

【专利技术属性】
技术研发人员：廖林，
申请(专利权)人：上海高德威智能交通系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人