手势控制方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号：32560835 阅读：22 留言：0更新日期：2022-03-09 16:44

本申请实施例提供了一种手势控制方法、装置、电子设备及计算机可读介质，涉及人工智能领域。其中,所述方法包括：对采集的视频帧图像进行基础特征提取，以获得视频帧图像的基础特征信息，其中，视频帧图像包括手部图像和手部连接部位的图像；基于视频帧图像的基础特征信息，获取手部连接部位的图像中的手部连接部位的特征信息；基于视频帧图像的基础特征信息和手部连接部位的特征信息，识别手部图像中的手部所对应的手势类别；基于手部所对应的手势类别，输出对应的设备控制信号对设备进行控制操作。通过本申请实施例，能够利用手部连接部位的特征信息识别手部所对应的手势，在节省手势识别的计算量和存储空间的同时保证手势识别的准确度。的准确度。的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
手势控制方法、装置、电子设备及计算机可读介质

[0001]本申请实施例涉及人工智能领域，尤其涉及一种手势控制方法、装置、电子设备及计算机可读介质。

技术介绍

[0002]随着计算机技术的发展，人机交互技术也得到了迅猛发展。目前较为成熟的人机交互方式具体包括：语音交互方式、手势交互方式、触控交互方式等。这些人机交互方式被应用于实现日常的功能，如音量、亮度、饱和度、温度、风速等参数的调节功能。目前，手势交互方式由于比较自然方便，在很多应用场景中具有很大的需求。在手势交互方式中需要进行手势识别。当前主流方案一般都是多阶段方法，例如，会包含人手检测模型、人手分类模型、人手跟踪模型等，这种方案的缺陷在于，计算量过大，占用存储空间太大，从而不适用于存储空间较少、计算能力非常受限的设备。由此可见，如何有效节省手势交互方式中手势识别的计算量和存储空间成为当前亟待解决的技术问题。

技术实现思路

[0003]本申请的目的在于提出一种手势控制方法、装置、电子设备及计算机可读介质，用于解决现有技术中存在的如何有效节省手势交互方式中手势识别的计算量和存储空间的技术问题。
[0004]根据本申请实施例的第一方面，提供了一种手势控制方法。所述方法包括：对采集的视频帧图像进行基础特征提取，以获得所述视频帧图像的基础特征信息，其中，所述视频帧图像包括手部图像和手部连接部位的图像；基于所述视频帧图像的基础特征信息，获取所述手部连接部位的图像中的手部连接部位的特征信息；基于所述视频帧图像的基础特征信息和所述手部连接部位的特征信息，...

【技术保护点】

【技术特征摘要】
1.一种手势控制方法，所述方法包括：对采集的视频帧图像进行基础特征提取，以获得所述视频帧图像的基础特征信息，其中，所述视频帧图像包括手部图像和手部连接部位的图像；基于所述视频帧图像的基础特征信息，获取所述手部连接部位的图像中的手部连接部位的特征信息；基于所述视频帧图像的基础特征信息和所述手部连接部位的特征信息，识别所述手部图像中的手部所对应的手势类别；基于所述手部所对应的手势类别，输出对应的设备控制信号对设备进行控制操作。2.根据权利要求1所述的方法，其中，所述基础特征信息包括特征图，所述对采集的视频帧图像进行基础特征提取，以获得所述视频帧图像的基础特征信息，包括：对所述视频帧图像进行不同尺度的基础特征提取，以获得所述视频帧图像的多个不同尺度的特征图；所述对采集的视频帧图像进行基础特征提取之后，所述方法还包括：对所述视频帧图像的多个不同尺度的特征图进行特征融合，以获得所述视频帧图像的融合后的特征图。3.根据权利要求2所述的方法，其中，所述对所述视频帧图像的多个不同尺度的特征图进行特征融合，以获得所述视频帧图像的融合后的特征图，包括：通过特征金字塔的方式，对所述视频帧图像的多个不同尺度的特征图进行特征融合，以获得所述视频帧图像的融合后的特征图。4.根据权利要求1所述的方法，其中，所述基础特征信息包括特征图，且所述手部连接部位的特征信息包括所述手部连接部位的关键点的特征信息，所述基于所述视频帧图像的基础特征信息，获取所述手部连接部位的图像中的手部连接部位的特征信息，包括：对所述视频帧图像的特征图进行感兴趣区域的池化操作，以将所述感兴趣区域映射到所述特征图中得到所述手部连接部位的关键点的特征信息；基于所述手部连接部位的关键点的特征信息，确定所述手部连接部位的关键点的权重；基于所述手部连接部位的关键点的特征信息和权重，确定所述手部连接部位的关键点的加权后的特征信息。5.根据权利要求4所述的方法，其中，所述基于所述手部连接部位的关键点的特征信息，确定所述手部连接部位的关键点的权重，包括：对所述手部连接部位的关键点的特征向量进行降维处理，以获得所述手部连接部位的关键点对应的特征标量；对所述手部连接部位的关键点对应的特征标量进行归一化处理，以获得所述手部连接部位的关键点对应的特征标量的权重。6.根据权利要求5所述的方法，其中，所述对所述手部连接部位的关键点的特征向量进行降维处理，以获得所述手部连接部位的关键点对应的特征标量，包括：将所述手部连接部位的关键点的特征向量输入至输出维度为1维的全连接层，根据所
述全连接层的输出确定所述手部连接部位的关键点对应的特征标量。7.根据权利要求1所述的方法，其中，所述基础特征信息包括特征图，且所述手部连接部位的特征信息包括所述手部连接部位的关键点的特征信息，所述基于所述视频帧图像的基础特征信息和所述手部连接部位的特征信息，识别所述手部图像中的手部所对应的手势类别，包括：将所述视频帧图像的特征图与所述手部连接部位的关键点的特征向量进行拼接，以获得所述视频帧图像的拼接后的特征图；基于所述视频帧图像的拼接后的特征图，识别所述手部图像中的手部所对应的手势类别。8.根据权利要求1所述的方法，其中，所述方法还包括：基于所述视频帧图像的基础特征信息和所述手部连接部位的特征信息，识别所述手部图像中的手部所对应的手势的位置。9.根据权利要求8所述的方法，其中，所述基础特征信息包括特征图，且所述手部连接部位的特征信息包括所述手部连接部位的关键点的特征信息，所述基于所述视频帧图像的基础特征信息和所述手部连接部位的特征信息，识别所述手部图像中的手部所对应的手势的位置，包括：将所述视频帧图像的特征图与所述手部连接部位的关键点的特征向量进行拼接，以获得所述视频帧图像的拼接后的特征图；基于所述视频帧图像的拼接后的特征图，识别所述手部图像中的手部所对应的手势的位置。10.根据权利要求1所述的方法，其中，所述基于所述手部所对应的手势类别，输出对应的设备控制信号对设备进行控制操作，包括：基于预先配置的手势类别与设备控制信号的对应关系，确定与所述手势类别对应的设备控制信号，并输出对应的设备控制信号对设备进行控制操作。11.根据权利要求1所述的方法，其中，所述手部图像和所述手部连接部位的图像位于所述视频帧图像中的手势标记区域。12.一种控制方法，所述方法包括：对采集的视频帧图像进行基础特征提取，以获得所述视频帧图像的基础特征信息，其中，所述视频帧图像包括脚部图像和脚部连接部位的图像；基于所述视频帧图像的基础特征信息，获取所述脚部连接部位的图像中的脚部连接部位的特征信息；基于所述视频帧图像的基础特征信息和所述脚部连接部位...

【专利技术属性】
技术研发人员：刘宝龙，古鉴，邵柏韬，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人