基于Attention和SqueezeNet的多任务实时手势检测和识别方法技术

技术编号：26924410 阅读：73 留言：0更新日期：2021-01-01 22:49

本发明专利技术公开了一种基于Attention和SqueezeNet的多任务实时手势检测和识别方法。所述方法采用数据增强技术扩增数据集以达到较好的识别效果，并通过人工标注制作新的手势数据集；将Attention融合到全卷积网络BlitzNet的ResSkip残差结构和分割分支中，使模型更关注目标手势，降低背景的干扰，识别效果更好，并用SqueezeNet网络中的前15层代替BlitzNet的ResNet‑50作为手势特征提取器，设计出新的手势检测和识别模型。新模型将多个视觉任务（如手势识别和手势分割）联合训练，并通过两个不同的子网络分别进行手势识别与手势分割，使得通过单一网络就可以同时解决手势识别和分割两个问题，检测速度较快且准确率较高。本发明专利技术的模型是一种参数少、准确率高、检测速度快等综合性能突出的手势检测和识别模型。

全部详细技术资料下载

【技术实现步骤摘要】
基于Attention和SqueezeNet的多任务实时手势检测和识别方法
本专利技术涉及深度学习TensorFlow框架
和手势识别领域，具体涉及一种基于Attention(注意力机制)和SqueezeNet(卷积神经网络模型)的多任务实时手势检测和识别方法。
技术介绍
手势是人类之间交流和沟通必不可少的一部分，可以让我们的观点更好地被其他人理解。随着科技的进步，手势识别逐渐在各行各业发挥重要作用，例如临床医学、人机交互、安全驾驶和手语认知，在这些行业中，手势识别的准确性和实时性显得尤为重要。手势识别的一般流程分为图像采集、手势检测与分割、手势识别，其中手势检测与分割是关键的技术，手势分割的效果直接影响后续的手势识别。BlitzNet(目标检测模型)利用单一的网络同时解决检测和分割两个任务，且检测效果较好，速度也可以达到实时，不足之处就是模型参数较多。其它的模型也是多多少少存在一些不足，目前还缺乏一种模型参数少、准确率高、检测速度快等综合性能突出的手势检测和识别模型。
技术实现思路
基于上述背景，本专利技术提供一种基于Attention和SqueezeNet的多任务实时手势检测和识别方法。在模型训练时，Attention可以模仿人类的注意力机制，对目标有更多“关注”，快速找出有用的信息，赋予更高的权重，在残差网络中加入Attention可以让模型的性能得到提升；而SqueezeNet则是一种轻量级的网络模型，具有识别精度高且模型参数少的优势。本专利技术通过将手势数据集应用到目标检测...

【技术保护点】
1.基于Attention和SqueezeNet的多任务实时手势检测和识别方法，所述方法包括：/n(1)保留BlitzNet网络中下采样和上采样层以及检测和分割部分，将ResNet-50结构删去；/n(2)设计Attention，将Channel attention与Spatial attention并联起来，将两者生成的通道注意力特征图和空间注意力特征图做矩阵乘法，得到共同关注手势和位置信息的注意力特征图；/n(3)将BlitzNet中所有ResSkip块内最后一层卷积替换为Attention，ResSkip中第二层卷积的输出作为Attention的输入，而Attention的输出与上采样输入的求和又作为下一个上采样的输入；/n(4)在BlitzNet的分割分支后面添加Channel attention和Maxpool，将分割分支的卷积层输出作为Channel attention的输入，再经过Maxpool后的输出作为最终手势分割图；/n(5)将SqueezeNet网络中的前15层包括1个Conv、7个Fire Module、2个Maxpool作为网络开始部分的手势特征提取器，把最后...

【技术特征摘要】
1.基于Attention和SqueezeNet的多任务实时手势检测和识别方法，所述方法包括：
(1)保留BlitzNet网络中下采样和上采样层以及检测和分割部分，将ResNet-50结构删去；
(2)设计Attention，将Channelattention与Spatialattention并联起来，将两者生成的通道注意力特征图和空间注意力特征图做矩阵乘法，得到共同关注手势和位置信息的注意力特征图；
(3)将BlitzNet中所有ResSkip块内最后一层卷积替换为Attention，ResSkip中第二层卷积的输出作为Attention的输入，而Attention的输出与上采样输入的求和又作为下一个上采样的输入；
(4)在BlitzNet的分割分支后面添加Channelattention和Maxpool，将分割分支...

【专利技术属性】
技术研发人员：强保华，翟艺杰，王玉峰，彭博，李宝莲，陈锐东，庞远超，
申请(专利权)人：桂林电子科技大学，中国电子科技集团公司第五十四研究所，
类型：发明
国别省市：广西;45

全部详细技术资料下载我是这个专利的主人