超参数优化的方法、电子设备和计算机可读存储介质技术

技术编号：41374509 阅读：8 留言：0更新日期：2024-05-20 10:18

本申请提供一种超参数优化的方法、电子设备和计算机可读存储介质，属于电子设备技术领域，该方法应用于包括第一电子设备和第二电子设备的系统，方法包括：第一电子设备采集超参数，并分配给第二电子设备，其中，超参数是指在机器学习开始之前设置的参数，用于定义模型的结构和优化策略；所述第二电子设备基于超参数进行模型训练，并在模型训练的过程中，生成训练日志文件，训练日志文件至少包括用于评估所述超参数优良的评估数据；第一电子设备获取评估数据，基于评估数据确定超参数对应的评估值，并根据评估值确定最优的目标超参数。根据本申请实施例的超参数优化的方法，能够有效提升对超参数评估的鲁棒性，提升超参优化的运行效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及电子，尤其涉及一种超参数优化的方法、电子设备及计算机可读存储介质。

技术介绍

1、模型是人工智能(artificial intelligence，ai)类应用产品的核心，是利用学习算法在对应数据上进行训练获取。目前，大多数学习算法均有超参数对模型训练过程进行控制。超参数是在开始学习过程之前设置的参数，而不是通过训练得到的参数数据，如深度学习模型使用随机梯度下降算法进行训练时的学习率、随机森林模型中的树深度等。对不同的数据集，即使使用同一个学习算法，让模型达到最优表现的超参数配置往往也不同。所以，模型训练时，选择一组合适的超参数配置非常重要。

2、由于超参数设置没有规律，在实践中一般由算法工程师根据经验设置。在设置的过程中，需要不断试错调整，最终找到一个合适的超参数配置。人工设置超参数的形式存在明显弊端，首先，设置超参数需要算法工程师根据算法运行的状态进行不断调整，非常消耗算法工程师的精力。其次，调参效果依赖于算法工程师的经验，不同的工程师调参效果依赖于算法工程师的经验，调参效果存在差异，不能稳定保证算法发挥最佳性能。因此，自动设置学习算法获得超参数的技术应运而生，一般称此类技术为超参数优化。目前的超参数优化效率低，可靠性较低。

技术实现思路

1、有鉴于此，本专利技术提供一种超参数优化的方法、电子设备和计算机可读存储介质，能够有效解决超参数优化效率低，可靠性低的问题。

2、本申请的一些实施方式提供了一种超参数优化的方法、电子设备和计算机可读存储介质。

3、第一方面，本专利技术提供一种超参数优化的方法，应用于包括第一电子设备和第二电子设备的系统，方法包括：第一电子设备采集超参数，并分配给第二电子设备，其中，超参数是指在机器学习开始之前设置的，用于定义模型的结构和优化策略的参数；第二电子设备基于超参数进行模型训练，并在模型训练的过程中，生成训练日志文件，训练日志文件至少包括用于评估超参数优良的评估数据；第一电子设备获取评估数据，基于评估数据确定超参数对应的评估值，并根据评估值确定最优的目标超参数。

4、根据本申请实施例的超参数优化的方法，对于最终模型的依赖大大的降低，不会因模型在训练时的随机性，而导致对超参数的评估的鲁棒性降低。且不需要得到最终模型训练结束获得评估值，而是采用模型训练过程中的评估数据获得评估值，可以有效的提升超参数优化的效率，提升对超参数评估的鲁棒性，节约优化的时间，节约资源的开销。

5、作为本申请第一方面的一个实施例，评估数据为模型在迭代训练过程中得到的损失函数值。

6、作为本申请第一方面的一个实施例，损失函数值包括反映损失函数收敛速度最快的第一损失函数值，反映损失函数收敛的位置最小的第二损失函数值，以及反应损失函数的波动幅度最小的第三损失函数值。这些数据可以在训练过程得到，并且可以有效评估出超参数的优劣程度。

7、作为本申请第一方面的一个实施例，第一电子设备基于评估数据确定超参数对应的评估值，包括：第一电子设备根据第一损失函数值、第二损失函数值和第三损失函数值的和，确定评估值。该方法可以有效提高获得最优超参数的可靠性。

8、作为本申请第一方面的一个实施例，评估数据为模型在每一次迭代训练过程中得到的迭代模型对应的准确率，以及，评估值为准确率的数值。

9、作为本申请第一方面的一个实施例，第一电子设备获取评估数据，基于评估数据确定超参数对应的评估值，并根据评估值确定最优的目标超参数，包括：第一电子设备在第二电子设备对模型迭代训练过程中，每执行预设步数，获取与当前步数对应的评估数据；第一电子设备将每一次获得的评估值与当前最优的超参数的评估值进行比较，获取最优的评估值对应的超参数，并作为目标超参数。该方法不仅可以获得可靠的超参数的评估值，还可以基于实际步数确定评估的频率，提高评估的效率。

10、作为本申请第一方面的一个实施例，若第一电子设备确定当前的超参数被评估的次数达到预设次数，且评估结果均劣于当前最优的超参数，则通知第二电子设备放弃对超参数的训练，并采集新的超参数分配给第二电子设备进行模型的训练。通过该方法可以将较差的超参数提前结束对其的评估，减少资源的开销，同时提高超参数优化的效率。

11、作为本申请第一方面的一个实施例，系统至少包括两个第二电子设备，第一电子设备采集超参数，并分配给第二电子设备，包括：第一电子设备确定至少一个第二电子设备为空闲的状态，则采集超参数，并将超参数分配给空闲的第二电子设备。通过多个第二电子设备并行方式对超参数进行评估，可以提高模型训练中超参数优化的效率。

12、作为本申请第一方面的一个实施例，当第一电子设备确定无空闲的第二电子设备，则第一电子设备通过轮询的方式，依次询问第二电子设备，直到获得空闲的第二电子设备。采用轮询的方式可以方便及时的获得空闲第二电子设备，提高资源利用率。

13、作为本申请第一方面的一个实施例，当第一电子设备确定采集超参数的次数达到预设采集次数，则从当前正在使用的超参数和搜索算法原有的超参数中确定出最优的超参数，作为目标超参数。避免无限次的采样，影响整个超参数优化的效率。

14、作为本申请第一方面的一个实施例，电子设备采集超参数，包括：电子设备基于搜索算法从超参数空间中采集出一组超参数。

15、作为本申请第一方面的一个实施例，超参数空间是基于界面输入的搜索数据确定的。便于用户输入搜索配置的参数，同时可以最小限度的影响模型训练代码的入侵，提供工具的利用率。

16、作为本申请第一方面的一个实施例，搜索数据包括超参数的名称、类型、对应的范围、用于生成评估数据的关键字、指标、训练日志路径和并行评估池数。

17、作为本申请第一方面的一个实施例，指标包括速率、结果和稳定性。

18、作为本申请第一方面的一个实施例，第二电子设备对模型训练的评估训练配置参数通过界面输入。

19、作为本申请第一方面的一个实施例，评估训练配置参数包括训练环境、训练资源、训练算法、入口脚本和数据集。

20、第二方面，本申请还提供一种电子装置，包括：

21、超参数采集模块，用于采集超参数；

22、通信模块，用于与第二电子设备通信并发送超参数，并接收来至第二电子设备发送的训练日志文件，其中，训练日志文件是第二电子设备基于超参数对模型进行训练，并在模型训练的过程中生成的；

23、评估值确定模块，用于基于评估数据确定超参数对应的评估值；

24、超参数确定模块，用于根据评估值确定最优的超参数。

25、根据本申请实施例的电子装置，可以有效提高对超参数评估的鲁棒性，提升超参数优化的效率，节约优化的时间，节约资源的开销。

26、作为本申请第二方面的一个实施例，评估数据为模型在迭代训练过程中得到的损失函数值。

27、作为本文档来自技高网...

【技术保护点】

1.一种超参数优化的方法，应用于包括第一电子设备和第二电子设备的系统，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述评估数据为所述模型在迭代训练过程中得到的损失函数值。

3.根据权利要求2所述的方法，其特征在于，所述损失函数值包括反映损失函数收敛速度最快的第一损失函数值，反映损失函数收敛的位置最小的第二损失函数值，以及反应损失函数的波动幅度最小的第三损失函数值。

4.根据权利要求3所述的方法，其特征在于，所述第一电子设备基于所述评估数据确定所述超参数对应的评估值，包括：

5.根据权利要求1所述的方法，其特征在于，所述评估数据为所述模型在每一次迭代训练过程中得到的迭代模型对应的准确率，以及，所述评估值为所述准确率的数值。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述第一电子设备获取所述评估数据，基于所述评估数据确定所述超参数对应的评估值，并根据所述评估值确定最优的目标超参数，包括：

7.根据权利要求6所述的方法，其特征在于，

8.根据权利要求1-7任一项所述的

9.根据权利要求8所述的方法，其特征在于，当所述第一电子设备确定无空闲的所述第二电子设备，则所述第一电子设备通过轮询的方式，依次询问所述第二电子设备，直到获得空闲的所述第二电子设备。

10.根据权利要求1-9任一项所述的方法，其特征在于，当所述第一电子设备确定采集所述超参数的次数达到预设采集次数，则从当前正在使用的超参数和搜索算法原有的超参数中确定出最优的超参数，作为目标超参数。

11.根据权利要求1-10任一项所述的方法，其特征在于，所述电子设备采集超参数，包括：

12.根据权利要求11所述的方法，其特征在于，所述超参数空间是基于界面输入的搜索数据确定的。

13.根据权利要求12所述的方法，其特征在于，所述搜索数据包括超参数的名称、类型、对应的范围、用于生成所述评估数据的关键字、指标、训练日志路径和并行评估池数。

14.根据权利要求13所述的方法，其特征在于，所述指标包括速率、结果和稳定性。

15.根据权利要求12-14任一项所述的方法，其特征在于，所述第二电子设备对模型训练的评估训练配置参数通过所述界面输入。

16.根据权利要求15所述的方法，其特征在于，所述评估训练配置参数包括训练环境、训练资源、训练算法、入口脚本和数据集。

17.一种电子设备，其特征在于，包括：

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器运行时，以使得所述电子设备执行权利要求1-16任一项的所述第一电子设备执行的所述的方法，或第二电子设备执行的所述的方法。

19.一种包含指令的计算机程序产品，其特征在于，当该计算机程序产品在电子设备上运行时，以使得所述电子设备执行权利要求1-16任一项的所述第一电子设备执行的所述的方法，或第二电子设备执行的所述的方法。

...

【技术特征摘要】

1.一种超参数优化的方法，应用于包括第一电子设备和第二电子设备的系统，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述评估数据为所述模型在迭代训练过程中得到的损失函数值。

4.根据权利要求3所述的方法，其特征在于，所述第一电子设备基于所述评估数据确定所述超参数对应的评估值，包括：

7.根据权利要求6所述的方法，其特征在于，

8.根据权利要求1-7任一项所述的方法，其特征在于，所述系统至少包括两个所述第二电子设备，

10.根据权利要求1-9任一项所述的方法，其特征在于，当所述第一电子设备确定采集所述超参...

【专利技术属性】
技术研发人员：胡毅奇，齐林庆，马杰延，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人