一种基于改进制造技术

技术编号:39785129 阅读:7 留言:0更新日期:2023-12-22 02:26
本发明专利技术公开了一种基于改进

【技术实现步骤摘要】
一种基于改进YOLOv5的手势识别方法


[0001]本专利技术涉及目标检测
,具体涉及一种改进
YOLOv5
的手势识别检测方法


技术介绍

[0002]随着科技的高速发展,人类的生活越来越智能化,人机交互技术也受到了更大的关注,人机交互的发展给人类带了便利,手势作为人机交互的重要组成部分,已融入到人们生活之中,如现在火热的智能家居

手语教育都会用到手势识别技术

[0003]传统的人工提取特征方式是手势识别的常见的提取方式,但是这种提取方式不仅复杂繁琐而且还没有泛化性

近年来随着深度学习的不断发展,它在图像和声音识别中取得了重要成就

基于深度学习的手势识别技术成为一种新的趋势

与传统的手势识别技术相比,基于深度学习的手势识别技术是通过人们把手势图像数据传入神经网络去训练,完成学习的手势识别模型自己可以准确的识别不同手势

这种手势识别技术具有很强的鲁棒性,适用于不同场景下的手势识别

如专利申请号为
201710208528.1
一种手势识别

手势控制及多层神经网络训练方法

装置及电子设备

其中,手势识别方法,包括:通过多层神经网络对图像进行手势信息检测,得到所述图像中的手可能区域

手势可能类别及其概率;所述手势可能类别包括:无手势类别以及至少一种手势类别;如果检测得到的最大概率的手势可能类别为所述无手势类别,不输出所述图像的所述手可能区域的位置信息;否则,输出所述图像的所述手可能区域的位置信息以及检测得到的最大概率的手势可能类别

通过本专利技术实施例,实现了手势的准确识别和跟踪

[0004]现有的检测方法主要分为两种:两阶段方法和一阶段方法,两阶段检测方法如
R

CNN、SPP

Net、Fast R

CNN
通常精度较高,但速度较慢,而以
SSD

YOLO
为首的一阶段检测方法速度一般比
Two

stage
算法更快,但精度有所损失,
YOLOv5
作为当前
YOLO
网络系列的新版本,性能较之前版本有明显的提升,但在当前复杂的环境背景下,检测精度仍不够高,仅具有快速而不具备准确性的特点,如果采用
YOLOv5
网络识别手势其精度准确度无法得到保证,如果在使用
YOLO5v
的基础上实现检测准确度的提升是
YOLOv5
在手势识别领域研究的重点,现有技术无法相关技术的公开


技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种基于改进
YOLOv5
的手势识别方法,通过改进的
YOLOV5
模型来进行手势识别,通过改进实现具备检测速度快的同时具备检测精度高的优点

[0006]为了实现上述目的,本专利技术采用的技术方案为:一种基于改进
YOLOv5
的手势识别方法,包括:
[0007]对
YOLOv5
网络模型进行修改形成改进后的
YOLOv5
网络模型;
[0008]对改进后的
yolov5
网络模型进行训练得到训练后的
YOLOv5
网络模型;
[0009]利用训练后的
YOLOv5
网络模型输入待识别的图像数据后输出识别结果

[0010]改进后的
yolov5
网络模型包括输入层
、Backbone

、Neck

、Head
层;
[0011]其中,输入层包括依次串接的
Mosaic
数据增强模块

自适应锚框计算模块,用于对输入的数据进行输入处理

[0012]所述
Backbone
层采用
ShufflenetV2
轻量级网络完成信息融合输出

[0013]ShufflenetV2
轻量级网络结构包括
CBRM
模块
、Channel Shuffle
模块,输入层输入的图像数据依次经过串联的
CBRM
模块
、Channel Shuffle
模块
1、Channel Shuffle
模块
2、Channel Shuffle
模块
3、Channel Shuffle
模块
4、Channel Shuffle
模块
5、Channel Shuffle
模块
6、GSConv
模块引出
ShufflenetV2
轻量级网络的输出端子1;在
Channel Shuffle
模块
2、Channel Shuffle
模块3之间引出
ShufflenetV2
轻量级网络的输出端子2;在
Channel Shuffle
模块
4、Channel Shuffle
模块5之间引出
ShufflenetV2
轻量级网络的输出端子3;输出端子
1、2、3
分别输出提取到的不同尺寸的特征图,为
Neck
层网络的特征图的压缩和融合提供输入数据

[0014]所述
Neck
层结构将将主干网络
ShufflenetV2
轻量级网络提取到的特征进行压缩和融合,然后将处理后的特征图输入到
Head
层网络中

[0015]所述
Neck
层网络结构基于
YOLOv5
网络的
neck
网络改进得到,将
YOLOv5
网络的
neck
网络中的标准卷积
conv
替换为轻量级卷积
GSConv
;将
YOLOv5
网络的
neck
网络中的
CSP
模块替换为
VoVGSCSP
模块,并在
YOLOv5
网络的
neck
网络中的输出端增加设置有
CBAM
注意力机制模块

[0016]CBAM
注意力机制包括空间注意力模块和通道注意力模块两个部分,在通道注意力模块输出的特征图
F
经过全局最大池化和全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于改进
YOLOv5
的手势识别方法,其特征在于:对
YOLOv5
网络模型进行修改形成改进后的
YOLOv5
网络模型;对改进后的
yolov5
网络模型进行训练得到训练后的
YOLOv5
网络模型;利用训练后的
YOLOv5
网络模型输入待识别的图像数据后输出识别结果
。2.
如权利要求1所述的一种基于改进
YOLOv5
的手势识别方法,其特征在于:改进后的
yolov5
网络模型包括输入层
、Backbone

、Neck

、Head
层;其中,输入层包括依次串接的
Mosaic
数据增强模块

自适应锚框计算模块,用于对输入的数据进行输入处理
。3.
如权利要求2所述的一种基于改进
YOLOv5
的手势识别方法,其特征在于:所述
Backbone
层采用
ShufflenetV2
轻量级网络完成信息融合输出
。4.
如权利要求3所述的一种基于改进
YOLOv5
的手势识别方法,其特征在于:
ShufflenetV2
轻量级网络结构包括
CBRM
模块
、Channel Shuffle
模块,输入层输入的图像数据依次经过串联的
CBRM
模块
、Channel Shuffle
模块
1、Channel Shuffle
模块
2、Channel Shuffle
模块
3、Channel Shuffle
模块
4、Channel Shuffle
模块
5、Channel Shuffle
模块6引出
ShufflenetV2
轻量级网络的输出端子1;在
Channel Shuffle
模块
2、Channel Shuffle
模块3之间引出
ShufflenetV2
轻量级网络的输出端子2;在
ChannelShuffle
模块
4、Channel Shuffle
模块5之间引出
ShufflenetV2
轻量级网络的输出端子3;输出端子
1、2、3
分别输出提取到的不同尺寸的特征图,为
Neck
层网络的特征图的压缩和融合提供输入数据
。5.
如权利要求4所述的一种基于改进
YOLOv5
的手势识别方法,其特征在于:所述
Neck
层结构将主干网...

【专利技术属性】
技术研发人员:孙永妍杭后俊吴亚玲
申请(专利权)人:安徽师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1