【技术实现步骤摘要】
一种手势识别方法及装置
[0001]本申请涉及计算机视觉
,特别涉及一种手势识别方法及装置。
技术介绍
[0002]目前采用的手势识别算法一般采用YOLO
‑
V4模型,YOLO
‑
V4模型需要通用计算能力较高的处理器执行,比如中央处理器(Central Processing Unit,CPU)或者图形处理器(Graphics Processing Unit,GPU)等。目前智能电视等显示设备中一般配置加速处理器,可以用于运行深度学习识别算法,处理人工智能(Artificial Intelligence,AI)运算和AI应用的实现,比如,目前常见的加速处理器包括嵌入式神经网络处理器(Neural Network Processing Unit,NPU)、加速处理器(Accelerated Processing Unit,APU)、深度学习处理器(Deep Learning Processing Unit,DPU)、张量处理器(Tensor Processing Unit,TPU)等。但 ...
【技术保护点】
【技术特征摘要】
1.一种手势识别方法,其特征在于,包括:获取待识别图片;通过神经网络模型从所述待识别图片中获取手部图像;通过所述神经网络模型针对所述手部图像经过连续多次在高维空间获取手部特征以及手部特征的下采样处理得到手部特征图,所述手部特征图包括手部图像中在不同维度、不同分辨率下的手部特征信息;通过所述神经网络模型对所述手部特征图进行多尺度的最大池化处理,并对多尺度最大池化处理后的特征图进行融合处理得到第一多尺度特征图,所述第一多尺度特征图包括所述手部图像的多个尺度的空间信息;通过所述神经网络模型根据所述第一多尺度特征图获得多个预测框分别对应的手势类别概率;其中,多个预测框为对所述待识别图片进行划分得到的;根据所述多个预测框分别对应的手势类别概率识别所述待识别图片中手部的手势。2.如权利要求1所述的方法,其特征在于,所述神经网络模型包括多个网络层级,每个网络层级包括一个或者多个级联恒等映射网络层以及下采样网络层;第一网络层级的恒等映射网络层,用于基于输入的图像在高维空间获取手部特征;所述第一网络层级的下采样网络层,用于在降低输入下采样网络层的图像的分辨率的情况下,对在高维空间获得的手部特征进行下采样处理得到的手部特征图,并输入到第二网络层级的恒等映射网络层;所述第一网络层级与所述第二网络层级为所述神经网络模型包括的多个网络层级中任意相邻的两个网络层级。3.如权利要求2所述的方法,其特征在于,所述恒等映射网络层包括第一卷积线性修正部分、第一深度可分离卷积修正部分以及第一卷积部分;所述第一卷积线性修正部分的输入与所述第一卷积部分跳跃连接;所述第一卷积线性修正部分由第一卷积层和第一修正线性单元ReLu组成,所述第一深度可分离卷积修正部分由第一深度可分离卷积层和第二修正线性单元ReLu组成,所述第一卷积部分包括第二卷积层。4.如权利要求2所述的方法,其特征在于,所述下采样网络层包括:第二卷积线性修正部分、第二深度可分离卷积修正部分以及第二卷积部分;所述第二卷积线性修正部分由第三卷积层和第三修正线性单元ReLu组成,所述第二深度可分离卷积修正部分由第二深度可分离卷积层和第四修正线性单元ReLu组成,所述第二卷积部分包括第四卷积层。5.如权利要求2所述的方法,其特征在于,在所述神经网络模型包括的最后一个网络层级中还包括直采样网络层;所述直采样网络层,用于在不改变输入所述直采样网络层的图像的分辨率的情况下,调整输入的直采样...
【专利技术属性】
技术研发人员:祝欣培,岳国华,
申请(专利权)人:海信视像科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。