【技术实现步骤摘要】
一种基于NAS技术的坐标识别模型的搜索方法及装置
本申请涉及计算机视觉
,尤其涉及一种基于NAS技术的坐标识别模型的搜索方法及装置。本申请具体提供一种坐标识别模型的训练方法及装置。
技术介绍
目前,在对待识别图像中包含的人体的动作类别进行识别时,一般是通过预先手工设计并训练的神经网络模型从而实现的。但是,由于通过手工设计模型的方式缺乏对人体动作类别的针对性优化,因此,会降低神经网络模型在识别人体动作时的精度和速度。为了解决上述问题,相关技术中,可以通过神经网络搜索(NeuralArchitectureSearch,NAS)来自动设计神经网络模型中包含的网络结构。NAS通常包括搜索空间、搜索策略和性能评估策略三个主要模块。在不同的场景下,模型对于搜索空间、搜索策略和性能评估策略通常有不同的要求,因此,如果要将NAS应用到坐标识别中,需要结合坐标识别场景的实际需求,对NAS的三个主要模块进行针对化的设计。那么,如何能够结合NAS实现对坐标识别模型的自动设计,成为了一个亟待解决的问题。
技术实现思路
r>本申请实施例提供本文档来自技高网...
【技术保护点】
1.一种坐标识别模型的训练方法,其特征在于,包括:/n获取基线模型的各超参数的取值范围,并根据所述各超参数的取值范围,将不同取值下的超参数进行组合,生成多个数值组合,其中,所述数值组合中包含有各超参数,以及各超参数的取值;/n分别针对各数值组合,将所述基线模型的各超参数设置为任意一个数值组合中的各取值,获得该数值组合下的候选的坐标识别模型;/n分别针对各候选的坐标识别模型,将图像样本集输入至任意一个候选的坐标识别模型中进行训练,并计算该候选的坐标识别模型的误差值,其中,所述图像样本集中包含有各图像样本和对应的样本标签,所述样本标签表征图像样本中包含的各人体关键点的真实二维坐 ...
【技术特征摘要】
1.一种坐标识别模型的训练方法,其特征在于,包括:
获取基线模型的各超参数的取值范围,并根据所述各超参数的取值范围,将不同取值下的超参数进行组合,生成多个数值组合,其中,所述数值组合中包含有各超参数,以及各超参数的取值;
分别针对各数值组合,将所述基线模型的各超参数设置为任意一个数值组合中的各取值,获得该数值组合下的候选的坐标识别模型;
分别针对各候选的坐标识别模型,将图像样本集输入至任意一个候选的坐标识别模型中进行训练,并计算该候选的坐标识别模型的误差值,其中,所述图像样本集中包含有各图像样本和对应的样本标签,所述样本标签表征图像样本中包含的各人体关键点的真实二维坐标;
将满足预设的误差值条件的候选的坐标识别模型作为最终优化后的坐标识别模型。
2.如权利要求1所述的方法,其特征在于,分别针对各数值组合,将所述基线模型的各超参数设置为任意一个数值组合中的各取值,获得该数值组合下的候选的坐标识别模型之后,进一步包括:
获取决策信息,其中,所述决策信息为随机采样的搜索策略、基于强化学习的搜索策略或基于进化算法的搜索策略,所述搜索策略信息;
采用所述决策信息,从各候选的坐标识别模型中,确定出最终进行训练的各候选的坐标识别模型。
3.如权利要求1所述的方法,其特征在于,获取基线模型的各超参数的取值范围之前,进一步包括:
获取用户输入的目标运行条件,其中,所述目标运行条件至少包括目标速度条件和/或目标精度条件;
从预设的模型数据库中包含的各候选的基线模型中,查找到满足所述目标运行条件的基线模型。
4.如权利要求3所述的方法,其特征在于,将图像样本集输入至任意一个候选的坐标识别模型中进行训练,并计算该候选的坐标识别模型的误差值,具体包括:
分别针对获取到的图像样本集中的各图像样本,将任意一张图像样本输入至任意一个候选的坐标识别模型中,识别获得该图像样本中的人体包含的各人体关键点,以及各人体关键点对应的预测二维坐标,并分别计算各预测二维坐标与对应的真实二维坐标之间的欧式距离值;
根据计算出的各欧式距离值、图像样本的面积和预设的识别难度系数,确定该候选的坐标识别模型的误差值。
5.如权利要求4所述的方法,其特征在于,将满足预设的误差值条件的候选的坐标识别模型作为最终优化后的坐标识别模型,具体包括:
将所述误差值最小对应的候选的坐标识别模型,作为最终优化后的坐标识别模型。
6.如权利要求1-5任一项所述的方法,其特征在于,所述超参数至少包括以下一种或任意组合:卷积通道数、卷积层数、卷积类型。
7.如权利要求5所述的方法,其特征在于,将所述误差值最小对应的候选的坐标识别模型,作为最终优化后的坐标识别模型之后,进一步包括:
获取待识别图像,其中,所述待识别图像中包含有人体;
基于所述优化后的坐标识别模型,以所述待识别图像为输入参数,识别所述待识别图像中包含的各人体关键点,并获取所述各人体关键点的二维坐标;
根据所述各人体关键点的二维坐标,识别所述待识别图像中包含的人体的人体动作类别。
8.一种坐标识别模型的训练装置,其特征在于,包括:
第一获取模块,用于获取基线模型的各超参数的取值范围,并根据所述各超参数的取值范围,将不同取值下的超参数进行组合,生成多个数值组合,其中,所述数值组合中包含有各超参数,以及各...
【专利技术属性】
技术研发人员:王蔚,田晓玮,聂学成,
申请(专利权)人:上海依图网络科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。