一种评估、以及预测深度学习模型中层计算时间的方法技术

技术编号：20945066 阅读：24 留言：0更新日期：2019-04-24 02:37

本发明专利技术提供一种评估、以及预测深度学习模型中层计算时间的方法。该方法根据层间相似程度在待预测层两侧选择历史日志中的相似层计算时间赋值最大、最小计算时间，以此评估、以及预测层计算时间，使利用相似层计算时间估算的待预测层计算时间在可接受范围内。该发明专利技术通过尽可能地利用历史日志中的相似层估算待预测层的计算时间，避免对部分的层做不必要的重复测量；同时又通过评估在一定程度上避免估算的误差，获得在可接受范围内的层计算时间。

A Method for Evaluating and Predicting Middle-Level Computing Time in Deep Learning Model

The invention provides a method for evaluating and predicting middle-level computing time in a deep learning model. According to the similarity between layers, the method chooses the maximum and minimum computing time of the similar layer in the history log to evaluate and predict the computing time of the similar layer, so that the computing time of the waiting layer estimated by the similar layer can be within the acceptable range. The invention estimates the computing time of the layer to be predicted by using the similar layers in the historical log as much as possible, avoiding unnecessary repeated measurements of some layers, and at the same time obtains the computing time of the layer within an acceptable range by avoiding the estimation error to a certain extent.

全部详细技术资料下载

【技术实现步骤摘要】
一种评估、以及预测深度学习模型中层计算时间的方法
本专利技术涉及深度学习
；具体地，涉及一种评估、以及预测深度学习模型中层计算时间的方法。
技术介绍
深度学习目前已经在诸如金融保险、安防监控等个行业得到了广泛应用。深度学习的核心方法是使用神经网络模型分析和描述数据的特征。训练一个深度学习的模型需要以秒为数量级的频率进行多轮迭代。其次，相较于线性算法，深度学习往往需要更为庞大的数据训练方能取得准确的模型。训练一个神经网络模型往往需要数天或者数周的时间才能完成。正是因为上面的原因，仅靠单一节点来训练深度学习模型显然需要花费更长的时间；对此，当前主流的深度学习框架均支持通过并行计算实现分布式训练模型。广义上的分布式训练包括两种：一种是数据并行，另一种是模型并行。在数据并行的场景下，通过预测深度学习模型的训练时间，对动辄数天、数周、数月的深度学习模型训练过程中的资源调配、模型评估等都有着重要的意义。特别是在多个不同的模型训练任务并存的情形下，提前预测训练时间，合理调配资源，将大幅提高资源利用率。对此，通过少量层的测量历史日志，并结合相似层关系复用上述层的时间，将大大降低预测模型训练中迭代时间时的开销。此外，测量/预测深度学习模型中各层计算时间，对模型以层粒度进行针对性调整也有着重要意义。
技术实现思路
有鉴于此，本专利技术提供一种评估、以及预测深度学习模型中层计算时间的方法。该方法根据层间相似程度在待预测层两侧选择历史日志中的相似层计算时间赋值最大、最小计算时间，以此评估、以及预测层计算时间，使利用相似层计算时间估算的待预测层计算时间在可接受范围内。一方面，本专...

【技术保护点】
1.一种评估层计算时间估算的方法，其特征在于，该方法包括：对于任一的待预测层，分别将该待预测层的最大计算时间、最小计算时间初始化为0和无穷大；从历史日志中，选择在偏序关系上计算时间大于该待预测层的相似层，将这些相似层计算时间按大小排序，选择其中的最小值作为该待预测层的最大计算时间；选择在偏序关系上计算时间小于该待预测层的相似层，将这些相似层计算时间按大小排序，选择其中的最大值作为该待预测层的最小计算时间；根据上述的最大计算时间、最小计算时间评估估算是否可接受：若该最大计算时间、最小计算时间之差小于设定的阈值，则该估算可接受；否则，该估算不可接受；其中，根据关键属性确定所述的相似层：对于任一的该待预测层的相同类型的层，若其与该待预测层全部的相应的关键属性都相同，则其为该待预测层的相似层；所述的偏序关系是指存在与该待预测层和其部分或全部的相似层中的如下偏序关系：对它们中任一的正向影响层计算时间的非关键属性，若该非关键属性单调增加时使其计算时间单调增加，且对它们中任一的反向影响层计算时间的非关键属性，若该非关键属性单调减小时使其计算时间单调增加。

【技术特征摘要】
1.一种评估层计算时间估算的方法，其特征在于，该方法包括：对于任一的待预测层，分别将该待预测层的最大计算时间、最小计算时间初始化为0和无穷大；从历史日志中，选择在偏序关系上计算时间大于该待预测层的相似层，将这些相似层计算时间按大小排序，选择其中的最小值作为该待预测层的最大计算时间；选择在偏序关系上计算时间小于该待预测层的相似层，将这些相似层计算时间按大小排序，选择其中的最大值作为该待预测层的最小计算时间；根据上述的最大计算时间、最小计算时间评估估算是否可接受：若该最大计算时间、最小计算时间之差小于设定的阈值，则该估算可接受；否则，该估算不可接受；其中，根据关键属性确定所述的相似层：对于任一的该待预测层的相同类型的层，若其与该待预测层全部的相应的关键属性都相同，则其为该待预测层的相似层；所述的偏序关系是指存在与该待预测层和其部分或全部的相似层中的如下偏序关系：对它们中任一的正向影响层计算时间的非关键属性，若...

【专利技术属性】
技术研发人员：孙军欢，张骏雪，
申请(专利权)人：北京瀚海星云科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人