图像处理方法和装置制造方法及图纸

技术编号:20449723 阅读:14 留言:0更新日期:2019-02-27 03:27
本申请实施例公开了图像处理方法和装置。该方法的一具体实施方式包括:获取已标注对象的姿态的图像;基于该图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将该图像输入卷积神经网络,基于该卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态;将重合度大于预设重合度阈值的候选框作为目标候选框;对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值;将各个关键点的位置平均值的集合作为对该图像检测到的一个姿态。本实施例通过重合度对各个候选姿态进行筛选并取得关键点的平均值,以准确地分辨出图像中的各个姿态。

【技术实现步骤摘要】
图像处理方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及图像处理方法和装置。
技术介绍
在确认人体关键点时,有时需要确认单人的关键点,有时则需要确认多个人中每个人的关键点。在相关技术中,检测多个人中每个人的关键点时,通常难以准确地检测出结果。
技术实现思路
本申请实施例提出了图像处理方法和装置。第一方面,本申请实施例提供了一种图像处理方法,包括:获取已标注对象的姿态的图像,其中,图像包含至少两个对象,不同对象的姿态不同,姿态通过多个关键点指示;基于图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将图像输入卷积神经网络,基于卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态;确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度,将重合度大于预设重合度阈值的候选框作为目标候选框;对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值;将各个关键点的位置平均值的集合作为对图像检测到的一个姿态。在一些实施例中,在将图像输入卷积神经网络,基于卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态之前,方法还包括:对目标图像中的多个预设姿态进行聚类,得到关键点集合;将各个关键点集合确定为锚点姿态,其中,不同关键点集合所包括的关键点在目标图像中的位置不同。在一些实施例中,对目标图像中的多个预设姿态进行聚类,得到关键点集合,包括:对各个预设姿态所对应的多维向量进行聚类,其中,预设姿态所对应的多维向量的维度数量与预设姿态的关键点数量相同;将聚类中心的多维向量所对应的姿态的各个关键点组成关键点集合。在一些实施例中,对于每个标注框所对应的目标候选框的每一个关键点,取各个目标候选框内候选姿态中的该关键点的位置平均值,包括:对于每个标注框所对应的每个目标候选框内的每一个关键点,响应于确定该关键点的位置在该标注框以外,将预设的第一预设权重作为该目标候选框内的该关键点的权重;响应于确定该关键点的位置在该标注框以内,将预设的第二预设权重作为该目标候选框内的该关键点的权重,第一预设权重小于第二预设权重;基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。在一些实施例中,对于每个标注框所对应的目标候选框的每一个关键点,取各个目标候选框内候选姿态中的该关键点的位置平均值,包括:对于每个标注框所对应的每个目标候选框内的每一个关键点,确定该关键点与已标注的姿态中该关键点的距离是否小于或等于预设距离阈值;响应于确定小于或者等于,基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。第二方面,本申请实施例提供了一种图像处理装置,包括:获取单元,被配置成获取已标注对象的姿态的图像,其中,图像包含至少两个对象,不同对象的姿态不同,姿态通过多个关键点指示;训练单元,被配置成基于图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将图像输入卷积神经网络,基于卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态;确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度,将重合度大于预设重合度阈值的候选框作为目标候选框;对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值;将各个关键点的位置平均值的集合作为对图像检测到的一个姿态。在一些实施例中,装置还包括:聚类单元,被配置成对目标图像中的多个预设姿态进行聚类,得到关键点集合;确定单元,被配置成将各个关键点集合确定为锚点姿态,其中,不同关键点集合所包括的关键点在目标图像中的位置不同。在一些实施例中,聚类单元,进一步被配置成:对各个预设姿态所对应的多维向量进行聚类,其中,预设姿态所对应的多维向量的维度数量与预设姿态的关键点数量相同;将聚类中心的多维向量所对应的预设姿态的各个关键点组成关键点集合。在一些实施例中,训练单元,进一步被配置成:被配置成对于每个标注框所对应的每个目标候选框内的每一个关键点,响应于确定该关键点的位置在该标注框以外,将预设的第一预设权重作为该目标候选框内的该关键点的权重;响应于确定该关键点的位置在该标注框以内,将预设的第二预设权重作为该目标候选框内的该关键点的权重,第一预设权重小于第二预设权重;基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。在一些实施例中,训练单元,进一步被配置成:对于每个标注框所对应的每个目标候选框内的每一个关键点,确定该关键点与已标注的姿态中该关键点的距离是否小于或等于预设距离阈值;响应于确定小于或者等于,基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如图像处理方法中任一实施例的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图像处理方法中任一实施例的方法。本申请实施例提供的图像处理方案,首先,获取已标注对象的姿态的图像,其中,图像包含至少两个对象,不同对象的姿态不同,姿态通过多个关键点指示。之后,基于图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将图像输入卷积神经网络,基于卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态。然后,确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度,将重合度大于预设重合度阈值的候选框作为目标候选框。而后,对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值。最后,将各个关键点的位置平均值的集合作为对图像检测到的一个姿态。本实施例能够从包括至少两个对象的图像中,通过重合度对各个候选姿态进行筛选,以选取指示对象更加准确的目标候选框。并且,取得关键点的平均值准确地分辨出图像中的各个姿态。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的图像处理方法的一个实施例的流程图;图3是根据本申请的图像处理方法的一个应用场景的示意图;图4是根据本申请的图像处理方法的又一个实施例的流程图;图5是根据本申请的图像处理装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的图像处理方法或图像处理装置的实施例的示例性系统架构100。如图1所示,系统架构100可以本文档来自技高网...

【技术保护点】
1.一种图像处理方法,包括:获取已标注对象的姿态的图像,其中,所述图像包含至少两个对象,不同对象的姿态不同,姿态通过多个关键点指示;基于所述图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将所述图像输入卷积神经网络,基于所述卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态;确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度,将重合度大于预设重合度阈值的候选框作为目标候选框;对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值;将各个关键点的位置平均值的集合作为对所述图像检测到的一个姿态。

【技术特征摘要】
1.一种图像处理方法,包括:获取已标注对象的姿态的图像,其中,所述图像包含至少两个对象,不同对象的姿态不同,姿态通过多个关键点指示;基于所述图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将所述图像输入卷积神经网络,基于所述卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态;确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度,将重合度大于预设重合度阈值的候选框作为目标候选框;对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值;将各个关键点的位置平均值的集合作为对所述图像检测到的一个姿态。2.根据权利要求1所述的方法,其中,在所述将所述图像输入卷积神经网络,基于所述卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态之前,所述方法还包括:对目标图像中的多个预设姿态进行聚类,得到关键点集合;将各个关键点集合确定为锚点姿态,其中,不同关键点集合所包括的关键点在所述目标图像中的位置不同。3.根据权利要求2所述的方法,其中,所述对目标图像中的多个预设姿态进行聚类,得到关键点集合,包括:对各个预设姿态所对应的多维向量进行聚类,其中,预设姿态所对应的多维向量的维度数量与预设姿态的关键点数量相同;将聚类中心的多维向量所对应的姿态的各个关键点组成关键点集合。4.根据权利要求1所述的方法,其中,所述对于每个标注框所对应的目标候选框的每一个关键点,取各个目标候选框内候选姿态中的该关键点的位置平均值,包括:对于每个标注框所对应的每个目标候选框内的每一个关键点,响应于确定该关键点的位置在该标注框以外,将预设的第一预设权重作为该目标候选框内的该关键点的权重;响应于确定该关键点的位置在该标注框以内,将预设的第二预设权重作为该目标候选框内的该关键点的权重,所述第一预设权重小于第二预设权重;基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。5.根据权利要求1述的方法,其中,所述对于每个标注框所对应的目标候选框的每一个关键点,取各个目标候选框内候选姿态中的该关键点的位置平均值,包括:对于每个标注框所对应的每个目标候选框内的每一个关键点,确定该关键点与已标注的姿态中该关键点的距离是否小于或等于预设距离阈值;响应于确定小于或者等于,基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。6.一种图像处理装置,包括:获取单元,被配...

【专利技术属性】
技术研发人员:胡耀全
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1