一种人体姿态估计方法及相关装置制造方法及图纸

技术编号:37377690 阅读:13 留言:0更新日期:2023-04-27 07:20
本申请提供了一种人体姿态估计方法及相关装置,该人体姿态估计方法包括:基于连续预设帧数的第一原始图像,获取背景区域图像集;利用背景区域图像集进行背景建模,得到完整背景图像;对帧序号取值大于预设帧数的第二原始图像以及完整背景图像进行差分运算,得到对应于第二原始图像的前景目标图像;对前景目标图像进行特征提取及预测,得到对应于第二原始图像的人体姿态估计结果。通过本申请方案的实施,对多帧原始图像进行背景建模可获得较为完整的背景图,然后基于完整背景图对待检测图像进行去背景处理,再对前景目标进行姿态估计,可排除大部分背景干扰导致的误检,有效提高了人体骨架点检测结果的准确性。人体骨架点检测结果的准确性。人体骨架点检测结果的准确性。

【技术实现步骤摘要】
一种人体姿态估计方法及相关装置


[0001]本申请涉及图像处理
,尤其涉及一种人体姿态估计方法及相关装置。

技术介绍

[0002]近年来,随着深度学习技术的不断进步,人体姿态估计(也即人体骨架点检测)得到了较大发展,人体骨架点包括关节、五官等,通过这些关键点可以描述人体骨骼信息。目前,人体姿态估计技术在实际场景中的应用也越来越广泛,如娱乐健身、康复训练、动作识别等。
[0003]然而,在实际应用场景下,待检测图像中可能存在复杂背景,进而在人体姿态估计过程中容易受背景干扰而导致人体骨架点误检的问题。而为了克服此类问题,在相关技术中,针对当前帧待检测图像,通常直接将前一帧图像的背景区域作为参考,来获取当前帧图像的前景目标,然后对所获取的前景目标进行人体骨架点检测,但是,在运动场景下,前一帧图像的背景区域与当前帧图像的实际背景区域仅是具备一定相似性,在复杂运动场景下并不能为当前帧图像的人体骨架点检测提供准确参考,在实际应用中仍然存在较高的误检可能性,人体骨架点检测结果的整体准确性相对较低。

技术实现思路

[0004]本申请实施例提供了一种人体姿态估计方法及相关装置,至少能够解决相关技术中所提供的人体姿态估计方案的误检可能性较高,人体骨架点检测结果的整体准确性相对较低的问题。
[0005]本申请实施例第一方面提供了一种人体姿态估计方法,包括:基于连续预设帧数的第一原始图像,获取背景区域图像集;其中,所述背景区域图像集包括对应于多帧所述第一原始图像的多张背景区域图像;利用所述背景区域图像集进行背景建模,得到完整背景图像;对第二原始图像以及所述完整背景图像进行差分运算,得到对应于所述第二原始图像的前景目标图像;其中,所述第二原始图像的帧序号取值大于所述预设帧数;对所述前景目标图像进行特征提取及预测,得到对应于所述第二原始图像的人体姿态估计结果。
[0006]本申请实施例第二方面提供了一种人体姿态估计装置,包括:获取模块,用于基于连续预设帧数的第一原始图像,获取背景区域图像集;其中,所述背景区域图像集包括对应于多帧所述第一原始图像的多张背景区域图像;建模模块,用于利用所述背景区域图像集进行背景建模,得到完整背景图像;运算模块,用于对第二原始图像以及所述完整背景图像进行差分运算,得到对应于所述第二原始图像的前景目标图像;其中,所述第二原始图像的帧序号取值大于所述预设帧数;估计模块,用于对所述前景目标图像进行特征提取及预测,得到对应于所述第二原始图像的人体姿态估计结果。
[0007]本申请实施例第三方面提供了一种电子设备,包括:图像采集装置及处理器,其中:图像采集装置用于采集原始图像并传输至所述处理器;处理器用于利用上述本申请实施例第一方面提供的人体姿态估计方法对所述原始图像进行处理,以获取人体姿态估计结
果。
[0008]本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述本申请实施例第一方面提供的人体姿态估计方法中的各步骤。
[0009]由上可见,根据本申请方案所提供的人体姿态估计方法及相关装置,基于连续预设帧数的第一原始图像,获取背景区域图像集;利用背景区域图像集进行背景建模,得到完整背景图像;对帧序号取值大于预设帧数的第二原始图像以及完整背景图像进行差分运算,得到对应于第二原始图像的前景目标图像;对前景目标图像进行特征提取及预测,得到对应于第二原始图像的人体姿态估计结果。通过本申请方案的实施,对多帧原始图像进行背景建模可获得较为完整的背景图,然后基于完整背景图对待检测图像进行去背景处理,再对前景目标进行姿态估计,可排除大部分背景干扰导致的误检,有效提高了人体骨架点检测结果的准确性。
附图说明
[0010]图1为本申请一实施例提供的应用场景的场景示意图;
[0011]图2为本申请一实施例提供的电子设备的结构示意图;
[0012]图3为本申请一实施例提供的人体姿态估计方法的基本流程示意图;
[0013]图4为本申请一实施例提供的一种人体姿态估计模型的检测流程示意图;
[0014]图5为本申请一实施例提供的一种特征提取网络的结构示意图;
[0015]图6为本申请一实施例提供的一种姿态预测网络的结构示意图;
[0016]图7为本申请一实施例提供的人体姿态估计方法的细化流程示意图;
[0017]图8为本申请一实施例提供的人体姿态估计装置的程序模块示意图。
具体实施方式
[0018]为使得本申请的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019]在本申请实施例的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0020]此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0021]在本申请实施例中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以
是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请实施例中的具体含义。
[0022]下面将结合附图详细说明本申请实施例的一种人体姿态估计方法及相关装置。
[0023]为了提高了人体骨架点检测结果的准确性,本申请一实施例提供了一种人体姿态估计方法,应用于如图1所示的场景,在该应用场景中,可以包括图像采集设备10以及电子设备20,在一种实现方式中,图像采集设备10可以为相机,其传感器类型可视实际应用场景而定,在典型实施方式中,该相机可以为彩色相机、深度相机、灰度相机等中任意一种或多种组合;而电子设备20则是具备数据处理功能的各种终端设备,包括但不限于电视、智能手机、平板电脑、膝上型便携计算机和台式计算机等。
[0024]在图1所示的应用场景中,可以通过图像采集设备10连续采集多帧图像,然后将连续采集的图像发送至电子设备20。电子设备20针对所接收的前N帧图像也即第一原本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人体姿态估计方法,其特征在于,包括:基于连续预设帧数的第一原始图像,获取背景区域图像集;其中,所述背景区域图像集包括对应于多帧所述第一原始图像的多张背景区域图像;利用所述背景区域图像集进行背景建模,得到完整背景图像;对第二原始图像以及所述完整背景图像进行差分运算,得到对应于所述第二原始图像的前景目标图像;其中,所述第二原始图像的帧序号取值大于所述预设帧数;对所述前景目标图像进行特征提取及预测,得到对应于所述第二原始图像的人体姿态估计结果。2.根据权利要求1所述的人体姿态估计方法,其特征在于,所述对所述前景目标图像进行特征提取及预测,得到对应于所述第二原始图像的人体姿态估计结果的步骤,包括:将所述前景目标图像输入至训练完成的人体姿态估计模型中的特征提取网络,输出目标特征图像;将所述目标特征图像输入至所述人体姿态估计模型中的姿态预测网络,输出对应于所述第二原始图像的人体姿态估计结果。3.根据权利要求2所述的人体姿态估计方法,其特征在于,所述特征提取网络包括最大池化模块、多个级联的卷积模块以及平均池化模块;所述将所述前景目标图像输入至训练完成的人体姿态估计模型中的特征提取网络,输出目标特征图像的步骤,包括:将所述前景目标图像输入至训练完成的人体姿态估计模型中的特征提取网络,利用所述最大池化模块对所述前景目标图像进行最大池化处理,得到第一特征图像;将各所述卷积模块的输入以及输出进行特征融合后作为下一卷积模块的输入,利用多个级联的所述卷积模块对所述第一特征图像进行卷积处理,得到第二特征图像;利用所述平均池化模块对所述第二特征图像进行平均池化处理,得到目标特征图像。4.根据权利要求2所述的人体姿态估计方法,其特征在于,所述姿态预测网络包括多个级联的stage模块,所述stage模块包括关键点置信度预测网络以及关键点亲和度向量场预测网络;所述将所述目标特征图像输入至所述人体姿态估计模型中的姿态预测网络,输出对应于所述第二原始图像的人体姿态估计结果的步骤,包括:将所述目标特征图像输入至所述人体姿态估计模型中的姿态预测网络,依次利用各所述stage模块的所述关键点置信度预测网络获取关键点置信度图像,以及利用所述关键点亲和度向量场预测网络获取关键点亲和度向量场;将最后一个所述stage模块的所述关键点置信度图像以及所述关键点亲和度向量场融合后所得的输出,作为对应于所述第二原始图像的人体姿态估计结果;其中,相邻两个所述stage模块中,...

【专利技术属性】
技术研发人员:陈宇
申请(专利权)人:奥比中光科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1