一种图像处理的方法、设备及存储介质技术

技术编号：18351032 阅读：39 留言：0更新日期：2018-07-02 00:39

本发明专利技术实施例公开了一种图像处理的方法、设备及存储介质；该方法可以包括：基于设定的手部训练数据以及卷积神经网络CNN模型对视频的检测图像帧中的至少一个手部对象进行检测，并获取各手部对象的描述属性值；当所述各手部对象的描述属性值满足设定的触发条件时，基于设定的对象特征以及跟踪算法，对所述检测图像帧之后设定数量的跟踪图像帧中的手部对象进行跟踪。本发明专利技术实施例的技术方案通过将检测算法和跟踪算法进行融合，减少了在手部检测时所需的卷积计算次数，从而减少手部检测时计算代价，降低检测过程中所消耗的时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像处理的方法、设备及存储介质
本专利技术涉及家电
，尤其涉及一种图像处理的方法、设备及存储介质。
技术介绍
随着计算机技术以及信号处理技术的发展，越来越多的家电设备除了具有传统的按键操作控制之外，还能够根据用户的声音或者手势进行控制。通过手势对家电设备进行控制，那就需要对手部进行检测。目前相关的手部检测方案中，通常采用的是基于深度卷积神经网络(CNN，ConvolutionalNeuralNetwork)的手部检测方案，该方案设计了一个包含卷积层、池化层以及全连接层的深度卷积神经网络，对第一视角的RGB图像进行手部检测。由于该方案设置了深度较大的神经网络层，并且检测过程中需要对整个图像进行全卷积处理，因此，该方案的检测精度较高，但同时增加了计算代价，也就增加了方案在检测过程中所消耗的时间。
技术实现思路
为解决上述技术问题，本专利技术实施例期望提供一种图像处理的方法、设备及存储介质；能够减少计算代价，降低检测过程中所消耗的时间。本专利技术的技术方案是这样实现的：第一方面，本专利技术实施例提供了一种图像处理的方法，所述方法包括：基于设定的手部训练数据以及卷积神经网络CNN模型对视频的检测图像帧中的至少一个手部对象进行检测，并获取各手部对象的描述属性值；当所述各手部对象的描述属性值满足设定的触发条件时，基于设定的对象特征以及跟踪算法，对所述检测图像帧之后设定数量的跟踪图像帧中的手部对象进行跟踪。第二方面，本专利技术实施例提供了一种图像处理设备，所述设备包括：拍摄装置、存储器和处理器；其中，所述拍摄装置，配置为采集视频；所述存储器，配置为存储能够在所述处...
一种图像处理的方法、设备及存储介质

【技术保护点】
1.一种图像处理的方法，其特征在于，所述方法包括：基于设定的手部训练数据以及卷积神经网络CNN模型对视频的检测图像帧中的至少一个手部对象进行检测，并获取各手部对象的描述属性值；当所述各手部对象的描述属性值满足设定的触发条件时，基于设定的对象特征以及跟踪算法，对所述检测图像帧之后设定数量的跟踪图像帧中的手部对象进行跟踪。

【技术特征摘要】
1.一种图像处理的方法，其特征在于，所述方法包括：基于设定的手部训练数据以及卷积神经网络CNN模型对视频的检测图像帧中的至少一个手部对象进行检测，并获取各手部对象的描述属性值；当所述各手部对象的描述属性值满足设定的触发条件时，基于设定的对象特征以及跟踪算法，对所述检测图像帧之后设定数量的跟踪图像帧中的手部对象进行跟踪。2.根据权利要求1所述的方法，其特征在于，所述手部对象的描述属性值包括：手部对象在检测图像帧中的位置、手部对象在检测图像帧中的尺寸、手部对象的类别以及手部对象检测的置信度。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：预先收集家居场景下的常用手势数据，并对所述手势数据通过训练来获取所述手部训练数据。4.根据权利要求1所述的方法，其特征在于，当所述各手部对象的描述属性值满足设定的触发条件时，基于设定的对象特征以及跟踪算法，对所述检测图像帧之后设定数量的跟踪图像帧中的手部对象进行跟踪，包括：当手部对象的数量小于设定个数时，基于设定的对象特征以及跟踪算法，对所述跟踪图像帧中的手部对象进行跟踪；当手部对象的数量大于或等于设定个数时，基于所述手部训练数据以及所述CNN模型，对所述检测图像帧的后一帧图像中的至少一个手部对象进行检测，并获取各手部对象的描述属性值。5.根据权利要求1所述的方法，其特征在于，当所述各手部对象的描述属性值满足设定的触发条件时，所述方法还包括：将各手部对象的描述属性值设置为跟踪初始值，其中，所述各手部对象的跟踪初始值包括各手部对象在检测图像帧中的位置、各手部对象在检测图像帧中的尺寸以及各手部对象的类别。6.根据权利要求1所述的方法，其特征在于，所述对象特征包括方向梯度直方图HOG特征，或者灰度Gray特征；所述跟踪算法包括核相关滤波(KCF，KernelizedCorrelationFilters)算法。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：针对各手部对象设置对应的跟踪峰值peak_value；当各手部对象对应的跟踪峰值peak_value中至少一个跟踪峰值低于设定的跟踪峰值下限时，或者，当跟踪图像帧数量超出所述设定数量时，基于所述手部训练数据以及所述CNN模型，对当前跟踪图像帧的后一帧图像中的至少一个手部对象进行检测，并获取所述各手部对象的描述属性值。8.根据权利要求1至7任一项所述的方法，其特征在于，所述方法还包括：构建卷积神经网络，所述卷积神经网络至少包括四个网络层：图像输入层、至少一个卷积层、至少一个池化层和至少一个全连接层；当待检测物体数量低于预设阈值时，缩减所述CNN中卷积核的数量；将所述图像输入层输入的图像按照设定的边界判定策略划分为至少一个利用连续内存存储的内存数据段，并利用设定的连续内存拷贝函数对各内存数据段进行数据拷贝；按照设定的合并策略将批量正则化层中的原始参数与所述卷积层或所述全连接层的参数进行合并，将合并后的参数作为批量正则化层的新参数；其中，所述批量正则化层在所述卷积层或所述全连接层之后。9.根据权利要求8所述的方法，其特征在于，当待检测物体数量低于预设阈值时，缩减所述CNN中卷积核的数量，包括：当...

【专利技术属性】
技术研发人员：俞大海，陈术义，王欣博，周均扬，阮志锋，
申请(专利权)人：美的集团股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人