手势姿态识别关键帧提取方法、装置及可读存储介质制造方法及图纸

技术编号：28296557 阅读：20 留言：0更新日期：2021-04-30 16:21

本发明专利技术公开了一种手势姿态识别关键帧提取方法、装置及可读存储介质，该方法包括：通过训练好的手部检测深度学习模型对目标图像进行手部目标检测，以得到手部区域最小外接矩形的图形信息；进行手部区域分割，以得到只有手部的中间图像；计算第一时刻内各帧中间图像的熵值以及第二时刻内各帧中间图像的熵值；将第一时刻对应的熵值最大的中间图像二值化，以得到第一二值化图像，以及将第二时刻对应的熵值最大的中间图像二值化，以得到第二二值化图像，并计算所述第一二值化图像和所述第二二值化图像的手部重叠率；根据手部重叠率确定关键帧的提取。本发明专利技术能够解决现有技术不能提取较清晰的图像作为预测的关键帧的问题。

全部详细技术资料下载

【技术实现步骤摘要】
手势姿态识别关键帧提取方法、装置及可读存储介质
本专利技术涉及计算机
，特别是涉及一种手势姿态识别关键帧提取方法、装置及可读存储介质。
技术介绍
手势识别是人机交互的重要手段，在VR（VirtualReality，虚拟现实技术）人机交互中，用户可以通过虚拟手势识别，进行音量大小的调节或者其他虚拟移动按键的控制。由于硬件处理速度和产品体验要求，手势姿态估计需要满足实时性要求，因此，并不是视频流中所有的图像都做3D手势姿态识别，而是抽取部分关键帧进行识别，现有的解决方案主要有固定时间提取图像帧、随机抽样或者提供帧差法提取等，这些方法不能提取较清晰的图像作为预测的关键帧，模糊图像直接影响到3D手势姿态识别的准确性。
技术实现思路
为此，本专利技术的一个目的在于提出一种手势姿态识别关键帧提取方法，以解决现有技术不能提取较清晰的图像作为预测的关键帧的问题。本专利技术提供一种手势姿态识别关键帧提取方法，所述方法包括：通过训练好的手部检测深度学习模型对目标图像进行手部目标检测，以得到手部区域最小外接矩形的图形信息；根据所述手部区域最小外接矩形的图形信息，并通过皮肤检测算法，结合深度图，进行手部区域分割，以得到只有手部的中间图像；计算第一时刻内各帧中间图像的熵值，以获取第一时刻对应的熵值最大的中间图像，以及计算第二时刻内各帧中间图像的熵值，以获取第二时刻对应的熵值最大的中间图像，所述第一时刻与所述第二时刻为相邻的时刻；将所述第一时刻对应的熵值最大的中间图像二值...

【技术保护点】
1.一种手势姿态识别关键帧提取方法，其特征在于，所述方法包括：/n通过训练好的手部检测深度学习模型对目标图像进行手部目标检测，以得到手部区域最小外接矩形的图形信息；/n根据所述手部区域最小外接矩形的图形信息，并通过皮肤检测算法，结合深度图，进行手部区域分割，以得到只有手部的中间图像；/n计算第一时刻内各帧中间图像的熵值，以获取第一时刻对应的熵值最大的中间图像，以及计算第二时刻内各帧中间图像的熵值，以获取第二时刻对应的熵值最大的中间图像，所述第一时刻与所述第二时刻为相邻的时刻；/n将所述第一时刻对应的熵值最大的中间图像二值化，以得到第一二值化图像，以及将所述第二时刻对应的熵值最大的中间图像二值化，以得到第二二值化图像，并计算所述第一二值化图像和所述第二二值化图像的手部重叠率；/n若所述第一二值化图像和所述第二二值化图像的手部重叠率大于重叠度阈值，则丢弃所述第二时刻的关键帧，保留所述第一时刻的关键帧；若所述第一二值化图像和所述第二二值化图像的手部重叠率小于或等于重叠度阈值，则提取所述第二时刻的关键帧。/n

【技术特征摘要】
1.一种手势姿态识别关键帧提取方法，其特征在于，所述方法包括：
通过训练好的手部检测深度学习模型对目标图像进行手部目标检测，以得到手部区域最小外接矩形的图形信息；
根据所述手部区域最小外接矩形的图形信息，并通过皮肤检测算法，结合深度图，进行手部区域分割，以得到只有手部的中间图像；
计算第一时刻内各帧中间图像的熵值，以获取第一时刻对应的熵值最大的中间图像，以及计算第二时刻内各帧中间图像的熵值，以获取第二时刻对应的熵值最大的中间图像，所述第一时刻与所述第二时刻为相邻的时刻；
将所述第一时刻对应的熵值最大的中间图像二值化，以得到第一二值化图像，以及将所述第二时刻对应的熵值最大的中间图像二值化，以得到第二二值化图像，并计算所述第一二值化图像和所述第二二值化图像的手部重叠率；
若所述第一二值化图像和所述第二二值化图像的手部重叠率大于重叠度阈值，则丢弃所述第二时刻的关键帧，保留所述第一时刻的关键帧；若所述第一二值化图像和所述第二二值化图像的手部重叠率小于或等于重叠度阈值，则提取所述第二时刻的关键帧。

2.根据权利要求1所述的手势姿态识别关键帧提取方法，其特征在于，通过训练好的手部检测深度学习模型对目标图像进行手部目标检测，以得到手部区域最小外接矩形的图形信息的步骤具体包括：
获取RGB摄像头采集到的含有手部的RGB图像；
将所述RGB图像输入到已经训练好的所述手部检测深度学习模型中进行手部目标检测；
根据所述手部目标检测的检测结果，得到手部区域最小外接矩形的图形信息，所述图形信息包括最小外接矩形左上角顶点坐标、矩形的宽和高。

3.根据权利要求2所述的手势姿态识别关键帧提取方法，其特征在于，根据所述手部区域最小外接矩形的图形信息，并通过皮肤检测算法，结合深度图，进行手部区域分割，以得到只有手部的中间图像的步骤具体包括：
根据所述手部区域最小外接矩形的图形信息，将所述手部区域最小外接矩形之外的像素值全部置为0，所述手部区域最小外接矩形内部的像素值不变，以得到去背景后的RGB图像；
将所述去背景后的RGB图像转换到YCrCb空间，通过椭圆皮肤检测方法，对最小外接矩形内的皮肤进行检测，得到手部皮肤区域，并结合对应的深度图，计算所述手部皮肤区域的平均深度值dv；
将深度值小于dv-thrd或者大于dv+thrd的像素点去背景，得到只有手部的中间图像，其中，thrd表示深度阈值。

4.根据权利要求3所述的手势姿态识别关键帧提取方法，其特征在于，计算第一时刻内各帧中间图像的熵值，以获取第一时刻对应的熵值最大的中间图像的步骤具体包括：
对于第一时刻内的任一帧中间图像，先将中间图像灰度化，然后采用下式计算中间图像的熵值：

其中，H表示中间图像的熵值，pi表示灰度化后的中间图像中像素的灰度值为i的概率，i的取值范围为0~255，Mi表示灰度化后的中间图像中像素的灰度值为i的数量，Mpix表示灰度化后的中间图像中像素的总数。

5.根据权利要求4所述的手势姿态识别关键帧提取方法，其特征在于，计算所述第一二值化图像和所述第二二值化图像的手部重叠率的步骤中，采用下式计算手部重叠率：

其中，IOU表示第一二值化图像和所述第二二值化图...

【专利技术属性】
技术研发人员：毛凤辉，郭振民，熊斌，
申请(专利权)人：南昌虚拟现实研究院股份有限公司，
类型：发明
国别省市：江西;36

全部详细技术资料下载我是这个专利的主人