一种人手识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33835893 阅读:17 留言:0更新日期:2022-06-16 11:51
本发明专利技术实施例公开了一种人手识别方法、装置、电子设备及存储介质。人手识别方法具体可以包括:获取待识别图像,并在待识别图像中提取低层图像特征;对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;根据掌心点和人手描述信息,在待识别图像中识别人手区域。本发明专利技术实施例的技术方案能够减少人手识别过程中的计算量,简化人手识别任务,从而提高人手识别效率。从而提高人手识别效率。从而提高人手识别效率。

【技术实现步骤摘要】
一种人手识别方法、装置、电子设备及存储介质


[0001]本专利技术实施例涉及人工智能
,尤其涉及一种人手识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着科技的发展,对图像中的人手进行识别的应用越来越广泛,如虚拟/增强现实、人机交互、动作识别、辅助驾驶等领域,人手识别作为手势理解、手指关键点检测等任务的上游任务,也备受人们的重视。
[0003]在不同场景下(如站立、坐姿或手持物品),人手离摄像头的远近不同,导致人手在图像中的大小不一,人手识别难以学习,而且存在物体遮挡部分手的情况(如握住物体,部分手指不可见),为人手识别增加了难度。手的形态会随着手势的改变而改变,各个手指的相对位置也并非固定的,这又增大了学习难度。手都是由皮肤覆盖,缺乏明显辨别的特征,故当手贴在脸上或者接近肤色的地方,以及手指并拢的情况,会加大识别的难度。
[0004]目前,主要的人手识别方法通常是直接预测人手矩形框,或者,通过预测预设的人手矩形框的偏移量,选择最匹配的预测人手矩形框作为输出,预测人手矩形框一般是左上角或矩形框中心点的坐标,以及矩形框的宽高。专利技术人在实现本专利技术的过程中,发现:直接预测矩形框或者矩形框的偏移量,手中心点没有固定的位置,无法清晰定义手中心点,需要拟合的样例变得无穷多,也即需要很多预设的矩形框,导致人手识别过程中运算量较大,而且需要进行矩形框匹配选择,导致人手识别过程中复杂度较高。

技术实现思路

[0005]本专利技术实施例提供一种人手识别方法、装置、电子设备及存储介质,能够减少人手识别过程中的计算量,简化人手识别任务,从而提高人手识别效率。
[0006]根据本专利技术的一方面,提供了一种人手识别方法,包括:
[0007]获取待识别图像,并在待识别图像中提取低层图像特征;
[0008]对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;
[0009]对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
[0010]根据掌心点和人手描述信息,在待识别图像中识别人手区域。
[0011]根据本专利技术的另一方面,提供了一种人手识别方法,包括:
[0012]获取待识别图像,并将所述待识别图像输入至预先训练的人手识别模型中;所述人手识别模型包括:第一标准卷积网络,以及分别与第一标准卷积网络相连的形变卷积分支网络和第二标准卷积分支网络;
[0013]通过第一标准卷积网络,在待识别图像中提取低层图像特征,并将低层图像特征分别输入至形变卷积分支网络和第二标准卷积分支网络中;
[0014]通过形变卷积分支网络,对低层图像特征进行形变卷积处理,并获取与形变处理
结果匹配的掌心点;
[0015]通过第二标准卷积分支网络,对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
[0016]根据所述人手识别模型输出的掌心点和人手描述信息,在待识别图像中识别人手区域。
[0017]根据本专利技术的另一方面,提供了一种人手识别装置,包括:
[0018]低层图像特征提取模块,用于获取待识别图像,并在待识别图像中提取低层图像特征;
[0019]掌心点获取模块,用于对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;
[0020]人手描述信息获取模块,用于对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
[0021]人手区域识别模块,用于根据掌心点和人手描述信息,在待识别图像中识别人手区域。
[0022]根据本专利技术的另一方面,提供了一种人手识别装置,包括:
[0023]待识别图像处理模块,用于获取待识别图像,并将所述待识别图像输入至预先训练的人手识别模型中;所述人手识别模型包括:第一标准卷积网络,以及分别与第一标准卷积网络相连的形变卷积分支网络和第二标准卷积分支网络;
[0024]待识别图像处理模块,用于通过第一标准卷积网络,在待识别图像中提取低层图像特征,并将低层图像特征分别输入至形变卷积分支网络和第二标准卷积分支网络中;
[0025]第一低层图像特征处理模块,用于通过形变卷积分支网络,对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;
[0026]第二低层图像特征处理模块,用于通过第二标准卷积分支网络,对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
[0027]人手区域识别模块,用于根据所述人手识别模型输出的掌心点和人手描述信息,在待识别图像中识别人手区域。
[0028]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0029]至少一个处理器;以及
[0030]与所述至少一个处理器通信连接的存储器;其中,
[0031]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的人手识别方法。
[0032]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的人手识别方法。
[0033]本专利技术实施例的技术方案,通过获取待识别图像,并在待识别图像中提取低层图
像特征,对低层图像特征进行形变卷积处理,以获取与形变处理结果匹配的掌心点,并对低层图像特征进行标准卷积处理,以获取与标准处理结果匹配的人手描述信息,从而根据掌心点和人手描述信息,在待识别图像中识别人手区域,解决了现有的人手识别方法在人手识别过程中运算量较大以及复杂度较高等问题,能够减少人手识别过程中的计算量,简化人手识别任务,从而提高人手识别效率。
[0034]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0035]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036]图1是本专利技术实施例一提供的一种人手识别方法的流程图;
[0037]图2是本专利技术实施例二提供的一种人手识别方法的流程图;
[0038]图3是本专利技术实施例三提供的一种人手识别方法的流程图;
[0039]图4是本专利技术实施例三提供的一种人手识别方法的示例流程图;
[0040]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人手识别方法,其特征在于,包括:获取待识别图像,并在待识别图像中提取低层图像特征;对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;根据掌心点和人手描述信息,在待识别图像中识别人手区域。2.根据权利要求1所述的方法,其特征在于,对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点,包括:对低层图像特征进行特征偏移量提取,获取与所述低层图像特征中各特征点分别对应的水平偏移矩阵和垂直偏移矩阵;按照所述水平偏移矩阵和所述垂直偏移矩阵,对所述低层图像特征进行特征重排,得到重排图像特征;对所述重排图像特征进行标准卷积处理,得到重排特征提取结果,并根据所述重排特征提取结果,获取所述掌心点。3.根据权利要求2所述的方法,其特征在于,在按照所述水平偏移矩阵和所述垂直偏移矩阵,对所述低层图像特征进行特征重排,得到重排图像特征之前,还包括:按照预设的限制规则,对所述水平偏移矩阵和垂直偏移矩阵中的矩阵元素进行缩限处理,以约束低层图像特征中各特征点的偏移范围。4.根据权利要求2所述的方法,其特征在于,根据所述重排特征提取结果,获取所述掌心点,包括:将所述重排特征提取结果输入至掌心点热力图生成网络中,获取左手掌心点热力图和右手掌心点热力图;在所述左手掌心点热力图和所述右手掌心点热力图中,分别提取左手掌心点和右手掌心点。5.根据权利要求1所述的方法,其特征在于,对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,包括:将所述低层图像特征逐次输入至多个标准卷积层,获取与左右手的每项人手描述信息分别对应的标准特征提取结果;对各所述标准特征提取结果进行平均池化处理,得到与左右手分别对应的各所述人手描述信息。6.根据权利要求1所述的方法,其特征在于,获取待识别图像,包括:在检测到满足单人直播场景,或者单人短视频场景条件时,获取待识别图像。7.一种人手识别方法,其特征在于,包括:获取待识别图像,并将所述待识别图像输入至预先训练的人手识别模型中;所述人手识别模型包括:第一标准卷积网络,以及分别与第一标准卷积网络相连的形变卷积分支网络和第二标准卷积分支网络;通过第一标准卷积网络,在待识别图像中提取低层图像特征,并将低层图像特征分别输入至形变卷积分支网络和第二标准卷积分支网络中;通过形变卷积分支网络,对低层图像特征进行形变卷积处理,并获取与形变处理结果
匹配的掌心点;通过第二标准卷积分支网络,对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;根据所述人手识别模型输出的掌心点和人手描述信息,在待识...

【专利技术属性】
技术研发人员:林哲
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1