图像处理方法和装置制造方法及图纸

技术编号：20449723 阅读：14 留言：0更新日期：2019-02-27 03:27

本申请实施例公开了图像处理方法和装置。该方法的一具体实施方式包括：获取已标注对象的姿态的图像；基于该图像和对姿态的标注，对卷积神经网络进行训练，得到训练后的卷积神经网络，训练过程包括：将该图像输入卷积神经网络，基于该卷积神经网络的在先设置的锚点姿态，确定各个对象的候选姿态；将重合度大于预设重合度阈值的候选框作为目标候选框；对于每个标注框所对应的目标候选框内的每一个关键点，取各个目标候选框内的该关键点的位置平均值；将各个关键点的位置平均值的集合作为对该图像检测到的一个姿态。本实施例通过重合度对各个候选姿态进行筛选并取得关键点的平均值，以准确地分辨出图像中的各个姿态。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法和装置
本申请实施例涉及计算机
，具体涉及互联网
，尤其涉及图像处理方法和装置。
技术介绍
在确认人体关键点时，有时需要确认单人的关键点，有时则需要确认多个人中每个人的关键点。在相关技术中，检测多个人中每个人的关键点时，通常难以准确地检测出结果。
技术实现思路
本申请实施例提出了图像处理方法和装置。第一方面，本申请实施例提供了一种图像处理方法，包括：获取已标注对象的姿态的图像，其中，图像包含至少两个对象，不同对象的姿态不同，姿态通过多个关键点指示；基于图像和对姿态的标注，对卷积神经网络进行训练，得到训练后的卷积神经网络，训练过程包括：将图像输入卷积神经网络，基于卷积神经网络的在先设置的锚点姿态，确定各个对象的候选姿态；确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度，将重合度大于预设重合度阈值的候选框作为目标候选框；对于每个标注框所对应的目标候选框内的每一个关键点，取各个目标候选框内的该关键点的位置平均值；将各个关键点的位置平均值的集合作为对图像检测到的一个姿态。在一些实施例中，在将图像输入卷积神经网络，基于卷积神经网络的在先设置的锚点姿态，确定各个对象的候选姿态之前，方法还包括：对目标图像中的多个预设姿态进行聚类，得到关键点集合；将各个关键点集合确定为锚点姿态，其中，不同关键点集合所包括的关键点在目标图像中的位置不同。在一些实施例中，对目标图像中的多个预设姿态进行聚类，得到关键点集合，包括：对各个预设姿态所对应的多维向量进行聚类，其中，预设姿态所对应的多维向量的维度数量与预设姿态的关键点数量相同；将聚类中心的多维向量所对应的...

【技术保护点】
1.一种图像处理方法，包括：获取已标注对象的姿态的图像，其中，所述图像包含至少两个对象，不同对象的姿态不同，姿态通过多个关键点指示；基于所述图像和对姿态的标注，对卷积神经网络进行训练，得到训练后的卷积神经网络，训练过程包括：将所述图像输入卷积神经网络，基于所述卷积神经网络的在先设置的锚点姿态，确定各个对象的候选姿态；确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度，将重合度大于预设重合度阈值的候选框作为目标候选框；对于每个标注框所对应的目标候选框内的每一个关键点，取各个目标候选框内的该关键点的位置平均值；将各个关键点的位置平均值的集合作为对所述图像检测到的一个姿态。

【技术特征摘要】
1.一种图像处理方法，包括：获取已标注对象的姿态的图像，其中，所述图像包含至少两个对象，不同对象的姿态不同，姿态通过多个关键点指示；基于所述图像和对姿态的标注，对卷积神经网络进行训练，得到训练后的卷积神经网络，训练过程包括：将所述图像输入卷积神经网络，基于所述卷积神经网络的在先设置的锚点姿态，确定各个对象的候选姿态；确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度，将重合度大于预设重合度阈值的候选框作为目标候选框；对于每个标注框所对应的目标候选框内的每一个关键点，取各个目标候选框内的该关键点的位置平均值；将各个关键点的位置平均值的集合作为对所述图像检测到的一个姿态。2.根据权利要求1所述的方法，其中，在所述将所述图像输入卷积神经网络，基于所述卷积神经网络的在先设置的锚点姿态，确定各个对象的候选姿态之前，所述方法还包括：对目标图像中的多个预设姿态进行聚类，得到关键点集合；将各个关键点集合确定为锚点姿态，其中，不同关键点集合所包括的关键点在所述目标图像中的位置不同。3.根据权利要求2所述的方法，其中，所述对目标图像中的多个预设姿态进行聚类，得到关键点集合，包括：对各个预设姿态所对应的多维向量进行聚类，其中，预设姿态所对应的多维向量的维度数量与预设姿态的关键点数量相同；将聚类中心的多维向量所对应的姿态的各个关键点组成关键点集合。4.根据权利要求1所述的方法，其中，所述对于每个标注框所对应的目标候选框的每一个关键点，取各个目标候选框内候选姿态中的该关键点的位置平均值，包括：对于每个标注框所对应的每个目标候选框内的每一个关键点，响应于确定该关键点的位置在该标注框以外，将预设的第一预设权重作为该目标候选框内的该关键点的权重；响应于确定该关键点的位置在该标注框以内，将预设的第二预设权重作为该目标候选框内的该关键点的权重，所述第一预设权重小于第二预设权重；基于该标注框所对应的各个目标候选框内的该关键点的权重，确定各个目标候选框内的该关键点的位置平均值。5.根据权利要求1述的方法，其中，所述对于每个标注框所对应的目标候选框的每一个关键点，取各个目标候选框内候选姿态中的该关键点的位置平均值，包括：对于每个标注框所对应的每个目标候选框内的每一个关键点，确定该关键点与已标注的姿态中该关键点的距离是否小于或等于预设距离阈值；响应于确定小于或者等于，基于该标注框所对应的各个目标候选框内的该关键点的权重，确定各个目标候选框内的该关键点的位置平均值。6.一种图像处理装置，包括：获取单元，被配...

【专利技术属性】
技术研发人员：胡耀全，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人