搜索模型结构的方法、装置、设备和存储介质制造方法及图纸

技术编号：23191567 阅读：24 留言：0更新日期：2020-01-24 16:29

本申请公开了搜索模型结构的方法、装置、设备和计算机可读存储介质，涉及人工智能领域。该方法包括确定能够基于人脸图像来预测人脸关键点的信息的模型结构搜索空间。该模型结构搜索空间包括多个候选模型结构，其中每个候选模型结构指示将从人脸图像得到的多个特征图融合成用于预测人脸关键点的信息的输出特征图的融合方式，以及在融合中应用于多个特征图的相应操作。该方法还包括在该模型结构搜索空间中搜索适合用于预测特定类型的人脸关键点的信息的模型结构。本公开的实施例能够自动搜索适合用于人脸关键点预测任务的最优模型结构。

Methods, devices, devices and storage media for searching model structure

全部详细技术资料下载

【技术实现步骤摘要】
搜索模型结构的方法、装置、设备和存储介质
本公开的实施例主要涉及人工智能领域，并且更具体地，涉及用于搜索模型结构的方法、装置、设备和计算机可读存储介质。
技术介绍
近年来，深度学习技术在很多方向上都取得了巨大的成功。在深度学习技术中，模型结构(即，人工神经网络的结构)的好坏对最终模型的效果有非常重要的影响。由人工设计神经网络结构往往需要设计者具有非常丰富的经验和尝试非常多的组合方式。由于众多网络参数会产生非常多的组合方式，常规的随机搜索几乎是不可行。因此，最近几年神经网络架构搜索技术(NeuralArchitectureSearch，简称NAS)成为研究热点，其利用算法代替繁琐的人工操作来自动搜索最佳的神经网络架构。基于人脸图像来预测人脸关键点的信息(例如，人脸关键点在人脸图像中的位置和/或其所对应的深度)非常有挑战性。现有的人工设计的模型结构不能很好的解决这一问题，且人工设计的模型结构非常复杂，难以在低成本设备(诸如，手机)上实现实时预测。现有的模型结构自动搜索方法主要针对分类问题，无法直接应用于人脸关键点预测问题的模型结构自动搜索。
技术实现思路
根据本公开的示例实施例，提供了一种用于搜索模型结构的方案。在本公开的第一方面中，提供了一种用于搜索模型结构的方法。该方法包括确定能够基于人脸图像来预测人脸关键点的信息的模型结构搜索空间，该模型结构搜索空间包括多个候选模型结构，其中每个候选模型结构指示将从人脸图像得到的多个特征图融合成用于预测人脸关键点的信息的输出特征图的融合方式，以及...

【技术保护点】
1.一种用于搜索模型结构的方法，包括：/n确定能够基于人脸图像来预测人脸关键点的信息的模型结构搜索空间，所述模型结构搜索空间包括多个候选模型结构，其中每个候选模型结构指示将从人脸图像得到的多个特征图融合成用于预测人脸关键点的信息的输出特征图的融合方式，以及在所述融合中应用于所述多个特征图的相应操作；以及/n基于特定人脸关键点的类型，在所述模型结构搜索空间中搜索适合用于基于人脸图像来预测所述特定人脸关键点的信息的模型结构。/n

【技术特征摘要】
1.一种用于搜索模型结构的方法，包括：
确定能够基于人脸图像来预测人脸关键点的信息的模型结构搜索空间，所述模型结构搜索空间包括多个候选模型结构，其中每个候选模型结构指示将从人脸图像得到的多个特征图融合成用于预测人脸关键点的信息的输出特征图的融合方式，以及在所述融合中应用于所述多个特征图的相应操作；以及
基于特定人脸关键点的类型，在所述模型结构搜索空间中搜索适合用于基于人脸图像来预测所述特定人脸关键点的信息的模型结构。

2.根据权利要求1所述的方法，其中所述特定人脸关键点包括用于勾勒人脸轮廓和/或五官的稀疏关键点。

3.根据权利要求1所述的方法，其中所述特定人脸关键点包括用于描绘人脸细节的稠密关键点。

4.根据权利要求1所述的方法，其中所述特定人脸关键点的所述信息包括以下至少一项：
所述特定人脸关键点在人脸图像中的位置；以及
所述特定人脸关键点所对应的深度。

5.根据权利要求1所述的方法，其中在所述模型结构搜索空间中搜索所述模型结构包括：
选择所述多个候选模型结构之一作为种子模型结构；
确定用于所述种子模型结构的模型转移概率，所述模型转移概率指示所述种子模型结构经过一次转换而被转换成所述多个候选模型结构中的每个候选模型结构的相应概率；
迭代地执行以下操作，直到迭代终止条件被满足：
基于所述种子模型结构和所述模型转移概率，生成一组候选模型结构；
确定所述一组候选模型结构的性能指标；以及
响应于所述迭代终止条件未被满足，基于所述一组候选模型结构的所述性能指标，更新所述模型转移概率；以及
响应于所述迭代终止条件被满足，将所述一组候选模型结构中性能指标最好的候选模型结构确定为所述模型结构。

6.根据权利要求5所述的方法，其中所述迭代终止条件包括以下之一：
迭代次数达到阈值次数；或者
所述一组候选模型结构的性能指标变化量低于阈值。

7.根据权利要求5所述的方法，其中所述多个候选模型结构包括第一候选模型结构和第二候选模型结构，并且确定所述模型转移概率包括：
初始化所述模型转移概率，以使得所述种子模型结构经过一次转换而被转换成所述第一候选模型结构的概率与被转换成所述第二候选模型结构的概率相等。

8.根据权利要求5所述的方法，其中生成所述一组候选模型结构包括：
确定待生成的候选模型结构的数量；以及
通过对所述种子模型结构进行所述数量的转换，来生成所述一组候选模型结构。

9.根据权利要求5所述的方法，其中所述一组候选模型结构包括第三候选模型结构和第四候选模型结构，所述第三候选模型结构的性能指标优于所述第四候选模型结构的性能指标，并且更新所述模型转移概率包括：
更新所述模型转移概率，使得所述种子模型结构经过一次转换而被转换成所述第三候选模型结构的概率超过被转换成所述第四候选模型结构的概率。

10.根据权利要求5所述的方法，其中确定所述一组候选模型结构的性能指标包括：
针对所述一组候选模型结构中的每个候选模型结构，
训练所述候选模型结构以得到用于基于人脸图像来预测所述特定人脸关键点的信息的模型；
利用所述模型，基于人脸图像来预测所述特定人脸关键点的信息；以及
基于所述模型的预测结果，确定所述候选模型结构的性能指标。

11.一种用于搜索模型结构的装置，包括：
搜索空间确定模块，被配置为确定能够基于人脸图像来预测人脸关键点的信息的模型结构搜索空间，所述模型结构搜索空间包括多个候选模型结构，其中每个候选模型结构指示将从人脸图像得到的多个特征图融合成用于预测...

【专利技术属性】
技术研发人员：希滕，姜志超，张刚，温圣召，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人