【技术实现步骤摘要】
一种基于SSD-MobileNet的实时手势检测和识别方法及系统
本专利技术涉及图像识别的
,具体涉及一种基于SSD-MobileNet的实时手势检测和识别方法及系统。
技术介绍
随着目标检测技术的不断发展和深入,现代检测仪器精度的不断提升,各种先进的检测算法广泛应用于当下的智能设备中,其中手势检测和识别分析一直以来都是人机交互领域研究的重点。可以从不同的手部特征开始利用检测算法对手的表面纹理及外部姿态进行深入分析,达到检测和识别的目的。目前,针对实时手势检测与识别相结合的研究在确保高精度的情况下往往是借助较高端的外部硬件设备实现,如Leap公司制造的LeapMotion体感控制器,微软推出的Kinect体感周边外设,谷歌设计的ProjectSoli雷达芯片以及CyberGlove系统公司提供的数据手套设备等,能够达到良好的识别速度和精度,但不具备普适性。15年MintoL,ZanuttighP.等人在Exploitingsilhouettedescriptorsandsyntheticdataforhandgesturerecognition一文提出了一种实时手势识别方案,针对的是深度相机设备得到深度数据,从采集到的数据中提取出手部轮廓特征,然后输入到多类别支持向量机中,进行手势识别。检测技术的完备随之而来的是检测类别的丰富和完善,越来越多手势数据集的开源,为手势的检测和识别任务提供了很好的数据基础。然而目前对手势数据的整理和利用不是很充分,在检测速度和检测精度上还存在不足,严重制约了实时手势 ...
【技术保护点】
1.一种基于SSD-MobileNet的实时手势检测和识别方法,其特征在于,包括以下步骤:/nS1:获取原始egohands视频数据集,所述原始egohands视频数据集包括多帧原始数据集图像,对多帧原始数据集图像进行扩充处理,建立扩充数据集,执行S2;/nS2:建立SSD-MobileNet手部数据检测模型,所述SSD-MobileNet手部数据检测模型用于提取手势图像,所述SSD-MobileNet手部数据检测模型包括SSD网络及Mobilenet网络,对SSD-MobileNet手部数据检测模型进行训练并优化,执行S3;/nS3:使用SSD-MobileNet手部数据检测模型对自建的复杂背景下的数字手势数据集中的图像进行手势图像提取,获取手势识别数据集,执行S4;/nS4:建立改进的CNN的手势识别模型,使用手势识别数据集训练并优化改进的CNN的手势识别模型,执行S5;/nS5:获取待检测视频数据集,使用SSD-MobileNet手部数据检测模型对待检测视频数据集中的图像进行手势图像提取,使用改进的CNN的手势识别模型对手势图像进行手势识别,输出识别结果。/n
【技术特征摘要】
1.一种基于SSD-MobileNet的实时手势检测和识别方法,其特征在于,包括以下步骤:
S1:获取原始egohands视频数据集,所述原始egohands视频数据集包括多帧原始数据集图像,对多帧原始数据集图像进行扩充处理,建立扩充数据集,执行S2;
S2:建立SSD-MobileNet手部数据检测模型,所述SSD-MobileNet手部数据检测模型用于提取手势图像,所述SSD-MobileNet手部数据检测模型包括SSD网络及Mobilenet网络,对SSD-MobileNet手部数据检测模型进行训练并优化,执行S3;
S3:使用SSD-MobileNet手部数据检测模型对自建的复杂背景下的数字手势数据集中的图像进行手势图像提取,获取手势识别数据集,执行S4;
S4:建立改进的CNN的手势识别模型,使用手势识别数据集训练并优化改进的CNN的手势识别模型,执行S5;
S5:获取待检测视频数据集,使用SSD-MobileNet手部数据检测模型对待检测视频数据集中的图像进行手势图像提取,使用改进的CNN的手势识别模型对手势图像进行手势识别,输出识别结果。
2.根据权利要求1所述的一种基于SSD-MobileNet的实时手势检测和识别方法,其特征在于,所述S1中对多帧原始数据集图像进行扩充处理具体包括,
对多帧原始数据集图像进行随机翻转和/或平移和/或剪裁和/或亮度调整和/或对比度调整和/或加噪声和/或高斯模糊,获得不同对比度的手势数据,建立扩充数据集。
3.根据权利要求1或2所述的一种基于SSD-MobileNet的实时手势检测和识别方法,其特征在于,所述S2中对SSD-MobileNet手部数据检测模型进行训练并优化具体包括,
S231:按照比例,将扩充数据集分为训练集及测试集,抽取训练集中一部分验证集,执行S232;
S232:使用训练集训练SSD-MobileNet手部数据检测模型,使用验证集调节SSD-MobileNet手部数据检测模型参数,执行S233;
S233:使用测试集判断SSD-MobileNet手部数据检测模型是否完成优化,若否,执行S232,若是,执行S3。
4.根据权利要求1或2所述的一种基于SSD-MobileNet的实时手势检测和识别方法,其特征在于,所述S4具体包括以下步骤,
S41:建立改进的CNN的手势识别模型,执行S42;
S42:使用手势识别数据集训练并优化改进的CNN的手势识别模型,执行S43;
S43:获取改进的CNN的手势识别模型的优化评价参数,所述优化评价参数包括正类预测为正类结果参数TP、负类预测为正类结果参数FP、负类预测为正类结果参数FN、负类预测为负类结果参数TN,执行S44;
S44:根据优化评价参数计算改进的CNN的手势识别模型的评价指标,所述评价指标包括准确率、精确率及召回率,执行S45;
S45:根据改进的CNN的手势识别模型的评价指标判断改进的CNN的手势识别模型是否优化成功,若否,执行S42,若是执行S5。
5...
【专利技术属性】
技术研发人员:程志宇,徐国庆,许犇,张岚斌,付尧,罗京,
申请(专利权)人:武汉工程大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。