一种人手识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：33835893 阅读：17 留言：0更新日期：2022-06-16 11:51

本发明专利技术实施例公开了一种人手识别方法、装置、电子设备及存储介质。人手识别方法具体可以包括：获取待识别图像，并在待识别图像中提取低层图像特征；对低层图像特征进行形变卷积处理，并获取与形变处理结果匹配的掌心点；对低层图像特征进行标准卷积处理，并获取与标准处理结果匹配的人手描述信息，人手描述信息包括：掌心点与人手中心点间的偏移量，和人手宽高值；根据掌心点和人手描述信息，在待识别图像中识别人手区域。本发明专利技术实施例的技术方案能够减少人手识别过程中的计算量，简化人手识别任务，从而提高人手识别效率。从而提高人手识别效率。从而提高人手识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种人手识别方法、装置、电子设备及存储介质

[0001]本专利技术实施例涉及人工智能
，尤其涉及一种人手识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着科技的发展，对图像中的人手进行识别的应用越来越广泛，如虚拟/增强现实、人机交互、动作识别、辅助驾驶等领域，人手识别作为手势理解、手指关键点检测等任务的上游任务，也备受人们的重视。
[0003]在不同场景下(如站立、坐姿或手持物品)，人手离摄像头的远近不同，导致人手在图像中的大小不一，人手识别难以学习，而且存在物体遮挡部分手的情况(如握住物体，部分手指不可见)，为人手识别增加了难度。手的形态会随着手势的改变而改变，各个手指的相对位置也并非固定的，这又增大了学习难度。手都是由皮肤覆盖，缺乏明显辨别的特征，故当手贴在脸上或者接近肤色的地方，以及手指并拢的情况，会加大识别的难度。
[0004]目前，主要的人手识别方法通常是直接预测人手矩形框，或者，通过预测预设的人手矩形框的偏移量，选择最匹配的预测人手矩形框作为输出，预测人手矩形框一般是左上角或矩形框中心点的坐标，以及矩形框的宽高。专利技术人在实现本专利技术的过程中，发现：直接预测矩形框或者矩形框的偏移量，手中心点没有固定的位置，无法清晰定义手中心点，需要拟合的样例变得无穷多，也即需要很多预设的矩形框，导致人手识别过程中运算量较大，而且需要进行矩形框匹配选择，导致人手识别过程中复杂度较高。

技术实现思路

[0005]本专利技术实施例提供一种人手识别方法、装置、电子设备及存储...

【技术保护点】

【技术特征摘要】
1.一种人手识别方法，其特征在于，包括：获取待识别图像，并在待识别图像中提取低层图像特征；对低层图像特征进行形变卷积处理，并获取与形变处理结果匹配的掌心点；对低层图像特征进行标准卷积处理，并获取与标准处理结果匹配的人手描述信息，人手描述信息包括：掌心点与人手中心点间的偏移量，和人手宽高值；根据掌心点和人手描述信息，在待识别图像中识别人手区域。2.根据权利要求1所述的方法，其特征在于，对低层图像特征进行形变卷积处理，并获取与形变处理结果匹配的掌心点，包括：对低层图像特征进行特征偏移量提取，获取与所述低层图像特征中各特征点分别对应的水平偏移矩阵和垂直偏移矩阵；按照所述水平偏移矩阵和所述垂直偏移矩阵，对所述低层图像特征进行特征重排，得到重排图像特征；对所述重排图像特征进行标准卷积处理，得到重排特征提取结果，并根据所述重排特征提取结果，获取所述掌心点。3.根据权利要求2所述的方法，其特征在于，在按照所述水平偏移矩阵和所述垂直偏移矩阵，对所述低层图像特征进行特征重排，得到重排图像特征之前，还包括：按照预设的限制规则，对所述水平偏移矩阵和垂直偏移矩阵中的矩阵元素进行缩限处理，以约束低层图像特征中各特征点的偏移范围。4.根据权利要求2所述的方法，其特征在于，根据所述重排特征提取结果，获取所述掌心点，包括：将所述重排特征提取结果输入至掌心点热力图生成网络中，获取左手掌心点热力图和右手掌心点热力图；在所述左手掌心点热力图和所述右手掌心点热力图中，分别提取左手掌心点和右手掌心点。5.根据权利要求1所述的方法，其特征在于，对低层图像特征进行标准卷积处理，并获取与标准处理结果匹配的人手描述信息，包括：将所述低层图像特征逐次输入至多个标准卷积层，获取与左右手的每项人手描述信息分别对应的标准特征提取结果；对各所述标准特征提取结果进行平均池化处理，得到与左右手分别对应的各所述人手描述信息。6.根据权利要求1所述的方法，其特征在于，获取待识别图像，包括：在检测到满足单人直播场景，或者单人短视频场景条件时，获取待识别图像。7.一种人手识别方法，其特征在于，包括：获取待识别图像，并将所述待识别图像输入至预先训练的人手识别模型中；所述人手识别模型包括：第一标准卷积网络，以及分别与第一标准卷积网络相连的形变卷积分支网络和第二标准卷积分支网络；通过第一标准卷积网络，在待识别图像中提取低层图像特征，并将低层图像特征分别输入至形变卷积分支网络和第二标准卷积分支网络中；通过形变卷积分支网络，对低层图像特征进行形变卷积处理，并获取与形变处理结果
匹配的掌心点；通过第二标准卷积分支网络，对低层图像特征进行标准卷积处理，并获取与标准处理结果匹配的人手描述信息，人手描述信息包括：掌心点与人手中心点间的偏移量，和人手宽高值；根据所述人手识别模型输出的掌心点和人手描述信息，在待识...

【专利技术属性】
技术研发人员：林哲，
申请(专利权)人：广州虎牙科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人