姿态估计方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:29403512 阅读:18 留言:0更新日期:2021-07-23 22:41
本申请涉及一种姿态估计方法、装置、计算机设备和存储介质。所述方法包括:获取待进行姿态估计的目标图像;所述目标图像中包括待处理的目标对象;基于所述目标图像进行特征提取,获取第一提取特征;通过图像特征扩张网络对所述第一提取特征进行特征扩张,得到扩张图像特征;对所述扩张图像特征进行特征提取,得到第二提取特征;通过图像特征压缩网络对所述第二提取特征进行特征压缩,得到压缩图像特征;基于所述压缩图像特征确定所述目标图像中的所述目标对象对应的关键点位置信息,基于所述关键点位置信息对所述目标对象进行姿态估计。本方法能够提高姿态估计的效率。

【技术实现步骤摘要】
姿态估计方法、装置、计算机设备和存储介质
本申请涉及计算机视觉
,特别是涉及一种姿态估计方法、装置、计算机设备和存储介质。
技术介绍
随着计算机视觉技术的发展,姿态估计作为计算机视觉中的重要应用之一,也得到了快速的发展,被广泛应用于对象活动分析、视频监控或者对象交互等领域。例如,姿态估计中的人体姿态估计,通过人体姿态估计,可以在一张包含人体的图像中检测出人体的各个关键点。例如,可以通过人体姿态估计得到人体的五官、四肢或者关节等。因其具有的功能,被广泛应用到定格动画、拼贴舞蹈、透明人、走路拼接或者动作分类等场景。然而,目前的姿态估计方法,存在效率低的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高姿态估计效率的姿态估计方法、装置、计算机设备和存储介质。一种姿态估计方法,所述方法包括:获取待进行姿态估计的目标图像;所述目标图像中包括待处理的目标对象;基于所述目标图像进行特征提取,获取第一提取特征;通过图像特征扩张网络对所述第一提取特征进行特征扩张,得到扩张图像特征;对所述扩张图像特征进行特征提取,得到第二提取特征;通过图像特征压缩网络对所述第二提取特征进行特征压缩,得到压缩图像特征;基于所述压缩图像特征确定所述目标图像中的所述目标对象对应的关键点位置信息,基于所述关键点位置信息对所述目标对象进行姿态估计。在其中一个实施例中,所述图像特征扩张网络包括多个特征卷积通道,所述通过图像特征扩张网络对所述第一提取特征进行特征扩张,得到扩张图像特征包括:将所述第一提取特征分别输入到所述图像特征扩张网络对应的多个特征卷积通道中,各个所述特征卷积通道利用特征维度保持卷积核对所述第一提取特征进行卷积,得到各个所述特征卷积通道输出的卷积特征;综合各个所述特征卷积通道所述输出的卷积特征得到所述扩张图像特征。在其中一个实施例中,所述基于所述压缩图像特征确定所述目标图像中的所述目标对象对应的关键点位置信息包括:对所述压缩图像特征进行放大,得到放大的图像特征;对所述放大的图像特征进行卷积,得到第三提取特征;基于所述第三提取特征,确定所述目标图像中的所述目标对象对应的关键点位置信息。在其中一个实施例中,所述获取待进行姿态估计的目标图像包括:获取初始图像;对所述初始图像进行对象检测,得到所述初始图像中多个候选图像区域分别包括目标对象的概率;基于所述候选图像区域包括目标对象的概率从候选图像区域中选取得到包括目标对象的对象图像区域;根据所述对象图像区域,从所述初始图像中提取得到截取图像区域,将截取得到的图像作为待进行姿态估计的目标图像。在其中一个实施例中,所述根据所述对象图像区域,从所述初始图像中提取得到截取图像区域,将截取得到的图像作为待进行姿态估计的目标图像包括:获取所述对象图像区域中的中心坐标;获取所述对象图像区域对应的区域尺寸,基于所述区域尺寸以及尺寸外扩系数得到区域延伸值;基于所述中心坐标以及所述区域延伸值向所述区域延伸值所对应的延伸方向进行延伸,得到延伸坐标;将位于所述延伸坐标内的图像区域作为图像截取区域,将截取得到的图像作为待进行姿态估计的目标图像。在其中一个实施例中,所述关键点位置信息为多个,所述方法还包括:根据所述关键点位置信息与目标点位置信息的映射关系,将各个所述关键点位置信息转换为对应的目标点位置信息;所述目标点位置信息为所述关键点位置信息在所述初始图像中的位置信息;基于各个所述目标位置信息对所述目标对象进行姿态估计,得到所述目标图像对应的目标姿态。一种目标视频生成方法,,所述方法还包括:获取目标动作,确定所述目标动作所对应的姿态序列,所述姿态序列中的姿态按照顺序执行,得到所述目标动作;执行上述姿态估计方法,获取目标图像集合中各个目标图像对应的目标姿态;从所述目标图像集合中获取所述姿态序列中各个目标姿态所对应的图像,作为视频帧图像;按照所述姿态序列中姿态的排序对得到的所述视频帧图像进行排列,得到所述目标动作所对应的目标视频。一种姿态估计装置,所述装置包括:目标图像获取模块,用于获取待进行姿态估计的目标图像;所述目标图像中包括待处理的目标对象;第一提取特征模块,用于基于所述目标图像进行特征提取,获取第一提取特征;扩张图像特征得到模块,用于通过图像特征扩张网络对所述第一提取特征进行特征扩张,得到扩张图像特征;第二提取特征得到模块,用于对所述扩张图像特征进行特征提取,得到第二提取特征;压缩图像特征得到模块,用于通过图像特征压缩网络对所述第二提取特征进行特征压缩,得到压缩图像特征;关键点位置信息确定模块,用于基于所述压缩图像特征确定所述目标图像中的所述目标对象对应的关键点位置信息,基于所述关键点位置信息对所述目标对象进行姿态估计。在其中一个实施例中,扩张图像特征得到模块用于将所述第一提取特征分别输入到所述图像特征扩张网络对应的多个特征卷积通道中,各个所述特征卷积通道利用特征维度保持卷积核对所述第一提取特征进行卷积,得到各个所述特征卷积通道输出的卷积特征;综合各个所述特征卷积通道所述输出的卷积特征得到所述扩张图像特征。在其中一个实施例中,关键点位置信息确定模块用于对所述压缩图像特征进行放大,得到放大的图像特征;对所述放大的图像特征进行卷积,得到第三提取特征;基于所述第三提取特征,确定所述目标图像中的所述目标对象对应的关键点位置信息。在其中一个实施例中,目标图像获取模块用于获取初始图像;对所述初始图像进行对象检测,得到所述初始图像中多个候选图像区域分别包括目标对象的概率;基于所述候选图像区域包括目标对象的概率从候选图像区域中选取得到包括目标对象的对象图像区域;根据所述对象图像区域,从所述初始图像中提取得到截取图像区域,将截取得到的图像作为待进行姿态估计的目标图像。在其中一个实施例中,目标图像获取模块用于获取所述对象图像区域中的中心坐标;获取所述对象图像区域对应的区域尺寸,基于所述区域尺寸以及尺寸外扩系数得到区域延伸值;基于所述中心坐标以及所述区域延伸值向所述区域延伸值所对应的延伸方向进行延伸,得到延伸坐标;将位于所述延伸坐标内的图像区域作为截取图像区域,将截取得到的图像作为待进行姿态估计的目标图像。在其中一个实施例中,目标图像获取模块用于根据所述关键点位置信息与目标点位置信息的映射关系,将各个所述关键点位置信息转换为对应的目标点位置信息;所述目标点位置信息为所述关键点位置信息在所述初始图像中的位置信息;基于各个所述目标位置信息对所述目标对象进行姿态估计,得到所述目标图像对应的目标姿态。一种目标视频生成装置,所述装置用于获取目标动作,确定所述目标动作所对应的姿态序列,所述姿态序列中的姿态按照顺序执行,得到所述目标动作;获取目标图像集合中各个目标图像对应的目标姿态;从所述目标图像集合中获取所述姿态序列中各个目标姿态所对应的图像,作为视频帧图像;按照所述姿态序列中姿态的排序对得到的所述视频帧图像进行排列,得到所述目标动作所对应的目标视频。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器本文档来自技高网...

【技术保护点】
1.一种姿态估计方法,其特征在于,所述方法包括:/n获取待进行姿态估计的目标图像;所述目标图像中包括待处理的目标对象;/n基于所述目标图像进行特征提取,获取第一提取特征;/n通过图像特征扩张网络对所述第一提取特征进行特征扩张,得到扩张图像特征;/n对所述扩张图像特征进行特征提取,得到第二提取特征;/n通过图像特征压缩网络对所述第二提取特征进行特征压缩,得到压缩图像特征;/n基于所述压缩图像特征确定所述目标图像中的所述目标对象对应的关键点位置信息,基于所述关键点位置信息对所述目标对象进行姿态估计。/n

【技术特征摘要】
1.一种姿态估计方法,其特征在于,所述方法包括:
获取待进行姿态估计的目标图像;所述目标图像中包括待处理的目标对象;
基于所述目标图像进行特征提取,获取第一提取特征;
通过图像特征扩张网络对所述第一提取特征进行特征扩张,得到扩张图像特征;
对所述扩张图像特征进行特征提取,得到第二提取特征;
通过图像特征压缩网络对所述第二提取特征进行特征压缩,得到压缩图像特征;
基于所述压缩图像特征确定所述目标图像中的所述目标对象对应的关键点位置信息,基于所述关键点位置信息对所述目标对象进行姿态估计。


2.根据权利要求1所述的方法,其特征在于,所述图像特征扩张网络包括多个特征卷积通道,所述通过图像特征扩张网络对所述第一提取特征进行特征扩张,得到扩张图像特征包括:
将所述第一提取特征分别输入到所述图像特征扩张网络对应的多个特征卷积通道中,各个所述特征卷积通道利用特征维度保持卷积核对所述第一提取特征进行卷积,得到各个所述特征卷积通道输出的卷积特征;
综合各个所述特征卷积通道所述输出的卷积特征得到所述扩张图像特征。


3.根据权利要求1所述的方法,其特征在于,所述基于所述压缩图像特征确定所述目标图像中的所述目标对象对应的关键点位置信息包括:
对所述压缩图像特征进行放大,得到放大的图像特征;
对所述放大的图像特征进行卷积,得到第三提取特征;
基于所述第三提取特征,确定所述目标图像中的所述目标对象对应的关键点位置信息。


4.根据权利要求1所述的方法,其特征在于,所述获取待进行姿态估计的目标图像包括:
获取初始图像;
对所述初始图像进行对象检测,得到所述初始图像中多个候选图像区域分别包括目标对象的概率;
基于所述候选图像区域包括目标对象的概率从候选图像区域中选取得到包括目标对象的对象图像区域;
根据所述对象图像区域,从所述初始图像中提取得到截取图像区域,将截取得到的图像作为待进行姿态估计的目标图像。


5.根据权利要求4所述的方法,其特征在于,所述根据所述对象图像区域从所述初始图像中提取得到截取图像区域,将截取得到的图像作为待进行姿态估计的目标图像包括:
获取所述对象图像区域中的中心坐标;
获取所述对象图像区域对应的区域尺寸,基于所述区域尺寸以及尺寸外扩系数得到区域延伸值;
基于所述中心坐标以及...

【专利技术属性】
技术研发人员:贾配洋侯俊
申请(专利权)人:影石创新科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1