The invention provides a gesture detection model processing method, device, device and storage medium. The method of the invention is to acquire training set, which includes at least one set of training data including training image and training image annotation data, and train convolutional neural network according to the annotation data of training image and training image in training set. Gesture detection model; By inputting the image to be detected into the gesture detection model, the gesture type and position in the image to be detected can be detected, and the gesture recognition of the image to be detected without depth information can be realized. The hardware unit containing depth information is not needed, which reduces the cost. Compared with the existing technology using clustering method for gesture detection, the implementation of this paper For example, the convolution neural network model is used to improve the accuracy and efficiency of gesture detection.
【技术实现步骤摘要】
手势检测模型处理方法、装置、设备及存储介质
本专利技术涉及通信
,尤其涉及一种手势检测模型处理方法、装置、设备及存储介质。
技术介绍
在智能硬件全面普及的今天,人与智能硬件的交互方式和效率是影响用户体验的最大因素之一。传统的按键和触屏的交互方式在很多场景下已经不能满足用户与设备的交互的需求,语音交互的方式也在诸多场景下存在着需要唤醒词、环境嘈杂识别不准等问题。手势识别的交互方式可以很好的解决很多场景下人机交互不便的问题。现有的手势识别方法,通过包含深度信息的硬件单元采集手势的深度图像信息,对包含深度信息的图像采用聚类算法提取图像中的手势特征信息,采用隐马尔克夫等概率模型对手势特征信息进行分类,得到图像中的手势特征信息对应的手势类型,硬件成本高,手势识别的精度较低且效率慢。
技术实现思路
本专利技术提供一种手势检测模型处理方法、装置、设备及存储介质,用以解决现有的手势识别方法硬件成本高,手势识别的精度较低且效率慢的问题。本专利技术的一个方面是提供一种手势检测模型处理方法,包括:获取训练集合,所述训练集合包括至少一组包括训练图像及训练图像的标注数据的训练数据;根据所 ...
【技术保护点】
1.一种手势检测模型处理方法,其特征在于,包括:获取训练集合,所述训练集合包括至少一组包括训练图像及训练图像的标注数据的训练数据;根据所述训练集合中各训练图像和训练图像的标注数据,对卷积神经网络进行训练,得到手势检测模型。
【技术特征摘要】
1.一种手势检测模型处理方法,其特征在于,包括:获取训练集合,所述训练集合包括至少一组包括训练图像及训练图像的标注数据的训练数据;根据所述训练集合中各训练图像和训练图像的标注数据,对卷积神经网络进行训练,得到手势检测模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述训练集合中各训练图像和训练图像的标注数据,对卷积神经网络进行训练,得到手势检测模型之前,还包括:对所述训练集合中的训练图像进行数据增强处理,得到所述训练图像对应的增强图像;获取所述增强图像的标注数据;将所述增强图像和所述增强图像的标注数据作为一组训练数据添加到所述训练集合中。3.根据权利要求2所述的方法,其特征在于,所述对所述训练集合中的训练图像进行数据增强处理,包括:对所述训练集合中的训练图像进行以下至少一种数据增强处理:对所述训练集合中的训练图像进行图像翻转处理;根据图像变换参数对所述训练集合中的训练图像进行图像变换处理,所述图像变换参数包括以下至少一种:亮度参数、饱和度参数和色度参数;对所述训练集合中的训练图像进行图像剪裁处理;以及,对所述训练集合中的训练图像进行图像缩放处理。4.根据权利要求1所述的方法,其特征在于,所述根据所述训练集合中各训练图像和训练图像的标注数据,对卷积神经网络进行训练,得到手势检测模型,包括:根据第一训练集对所述卷积神经网络进行一轮训练及剪裁优化处理,得到本轮处理后的第一模型,所述第一训练集为所述训练集合的非空子集;根据第二训练集判断所述本轮处理后的第一模型是否满足预设迭代条件,所述第二训练集为所述训练集合的非空子集;若所述本轮处理后的第一模型满足所述预设迭代条件,则根据所述第一训练集对所述本轮处理后的第一模型进行新一轮训练集剪裁优化处理,直至新一轮处理后的第一模型不满足所述预设迭代条件时为止;若所述本轮处理后的第一模型不满足所述预设迭代条件,则将本轮或者上一轮处理后的第一模型确定为所述手势检测模型。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一训练集对所述卷积神经网络进行一轮训练及剪裁优化处理,得到本轮处理后的第一模型,包括:根据所述第一训练集对所述卷积神经网络进行一轮训练,得到本轮训练后的第二模型;将所述第二模型中所有小于本轮权重阈值的权重设为0,得到所述本轮处理后的第一模型,在后续的训练过程中,将不再更新设为0的权重。6.根据权利要求4所述的方法,其特征在于,所述根据所述第二训练集判断所述本轮处理后的第一模型是否满足预设迭代条件,包括:根据所述第二训练,计算所述本轮处理后的第一模型的手势检测准确率;若所述本轮处理后的第一模型的手势检测准确率大于预设阈值,则确定所述本轮处理后的第一模型满足预设迭代条件;若所述本轮处理后的第一模型的手势检测准确率小于或者等于所述预设阈值,则确定所述本轮处理后的第一模型不满足预设迭代条件。7.根据权利要求4所述的方法,其特征在于,所述根据所述第二训练集判断所述本轮处理后的第一模型是否满足预设迭代条件,包括:根据所述第二训练,计算所述本轮处理后的第一模型的手势检测准确率;若所述本轮处理后的第一模型的手势检测准确率与第一轮处理后的第一模型的手势检测准确率的差值小于预设差值,则确定所述本轮处理后的第一模型满足预设迭代条件;若所述本轮处理后的第一模型的手势检测准确率小于第一轮处理后的第一模型的手势检测准确率,并且所述本轮处理后的第一模型的手势检测准确率与第一轮处理后的第一模型的手势检测准确率的差值大于或者等于所述预设差值,则确定所述本轮处理后的第一模型满足预设迭代条件。8.根据权利要求1所述的方法,其特征在于,所述根据所述训练集合中各训练图像和训练图像的标注数据,对卷积神经网络进行训练,得到手势检测模型之后,还包括:将所述手势检测模型中的BN层叠加到对应的卷积层。9.根据权利要求1-8任一项所述的方法,其特征在于,所述根据所述训练集合中各训练图像和训练图像的标注数据,对卷积神经网络进行训练,得到手势检测模型之后,还包括:对所...
【专利技术属性】
技术研发人员:高原,胡扬,柏提,刘霄,李旭斌,孙昊,文石磊,丁二锐,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。