一种利用辅助图测量深度学习模型中层计算时间的方法技术

技术编号:20945065 阅读:22 留言:0更新日期:2019-04-24 02:37
本发明专利技术提供一种利用辅助图测量深度学习模型中层计算时间的方法。该方法通过构建空白的辅助图G’,以及将待测层插入到图G’的Pad层和Slice层中间,构建新的G”,测量图G’、G”的执行时间,并计算二者的差值,作为该待测层的计算时间。通过该方法测量层计算时间,结果准确,解决了直接测量层计算时间时存在的系统开销造成系统误差的问题。

A Method of Measuring Middle-Level Computing Time in Deep Learning Model by Using Auxiliary Graph

The invention provides a method for measuring middle-level calculation time in a depth learning model by using auxiliary graphs. This method constructs a blank auxiliary graph G', and inserts the layer to be measured into the middle of the Layer Pad and the Layer Slice of the graph G', constructs a new G, measures the execution time of the graph G', G', and calculates the difference between the two as the calculation time of the layer to be measured. Through this method, the calculation time of the measurement layer is accurate, and the problem of system error caused by system overhead in the calculation time of the direct measurement layer is solved.

【技术实现步骤摘要】
一种利用辅助图测量深度学习模型中层计算时间的方法
本专利技术涉及深度学习
;具体地,涉及一种利用辅助图测量深度学习模型中层计算时间的方法。
技术介绍
深度学习目前已经在诸如金融保险、安防监控等个行业得到了广泛应用。深度学习的核心方法是使用神经网络模型分析和描述数据的特征。相较于线性算法,深度学习往往需要更为庞大的数据训练方能取得准确的模型。训练一个神经网络模型往往需要数天或者数周的时间才能完成。对此,提前获知深度学习时间,并据此调度训练任务、合理分配资源,将可提高训练效率。深度学习模型,通常包括多个层,而训练时间有主要由各层计算时间决定。虽然训练时间,也在一定程度上受到参数传输时间的影响。但是,较之计算时间,模型训练过程中的传输时间可通过模型数据流图中的参数规模及网络带宽等以较容易的方式获得,本专利技术不做过多讨论。然而,对于深度学习模型中层计算时间的测量,根据现有技术来看,直接准确地测量层的计算时间是很困难的。这是由于模模型训练过程中存在着一些系统开销,如初始化、读取输入数据、计算损耗等,这些都会影响层计算时间的测量结果。
技术实现思路
有鉴于此,本专利技术提供一种利用辅助图测量深度学习模型中层计算时间的方法。该方法通过引入辅助图,解决了直接测量层计算时间时存在的系统开销导致测量不准确的问题。一方面,本专利技术提供一种用于测量深度学习模型中层的计算时间的辅助图。上述的用于测量深度学习模型中层计算时间的辅助图,包括:输入层、输出层,以及成对的Pad层和Slice层;其中,Pad层的输出即Slice层的输入;Pad层和Slice层中间可插入待测层构建新的图;在新图中,Pad层的输出作为待测层的输入,待测层的输出作为Slice层的输入;Pad层和Slice层均为大小和形状可变化的层,能够灵活地改变其输入、输出规模以适应待测层。可选地,前面述及的Slice层为稳定的层,即其开销不会随输入、输出规模的改变而剧烈变化。可选地,Pad层能够接受很小规模的输入并输出很大规模的输出;Slice层能够接受很大规模的输入并输出很小规模的输出。另一方面,本专利技术提供一种测量深度学习模型中层的计算时间的方法。结合第一方面,上述的测量深度学习模型中层的计算时间的方法,包括:构建第一方面述及的辅助图,记为G’;将待测层插入到辅助图G’的Pad层和Slice层中间,构建新的图G”;测量图G’、G”的执行时间Tc(G’)、Tc(G”),将图G”、G’间的时间差作为待测层的计算时间Tc,即Tc=Tc(G”)-Tc(G’)。可选地,在前面述及的图G’中,以待预测层的输入规模作为Pad层的输出规模,也即Slice层的输入规模。可选地,在图G’、G”中,输入层的输出规模、输出层的输入规模均很小(相对于待测层的输入、输出规模),以减少对测量结果的影响。可选地,在图G’、G”中,输入层、输出层的输入、输出规模均相同。可选地,前面述及的待预测层为多个层的组合,根据前面述及的方法测量可获得其执行时间。又一方面,本专利技术提供一种预测模型单轮迭代时间的方法。结合第二方面,上述的预测模型单轮迭代时间的方法,包括:解析获得模型中的层,遍历各层,对任一的层,若能根据历史日志中的相似层计算时间估算的,则估算其计算时间;否则,根据第二方面述及的方法测量其计算时间;同时,根据各层参数规模和传输速率计算其传输时间;根据流水线策略累加上述各层的传输时间和计算时间,得到该模型的单轮迭代时间。可选地,前面述及的历史日志中相似层的计算时间,也是通过第二方面述及的方法测量获得的。本专利技术提供的技术方案,较之现有技术,具有诸多有益效果,包括:误差小,测量更准确;通过引入辅助图,对层计算时间的测量、以及进一步对整个轮迭代时间的预测,都能够避免系统开销(如初始化、读取输入数据、计算损耗等)干扰。附图说明为更加清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对本专利技术中一部分实施例或现有技术描述中涉及的附图做简单介绍。图1为本专利技术一实施例提供一种测量深度学习模型中层的计算时间方法的测量过程示意图;其中,图1(a)为空白的辅助图G’,图1(b)为图G’在插入待测层li后构建的新的图G”。具体实施方式下面结合本专利技术实施例的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。以下为本专利技术的一个优选实施例。图1为本专利技术一实施例提供一种测量深度学习模型中层的计算时间方法的测量过程示意图;如图1所示,图1(a)即为构建的空白的辅助图G’,对应地,图1(b)即为将待测层li插入到图G’的Pad层和Slice层中间后构建的新图G”。其中,辅助图G’中的Slice层为稳定的层,即其开销不会随输入、输出规模的改变而剧烈变化;在整个测量过程中(包括图中测量待测层li时),图G’、G”中,输入层的输出规模、输出层的输入规模均被设定为S,且被控制在远小于待测层的输入、输出规模的范围内,以减少对测量结果的影响;这里,Pad层能够接受很小规模的输入并输出很大规模的输出;而Slice层能够接受很大规模的输入并输出很小规模的输出。在测量待测层li时,调整图G’中的Pad层的输出规模,也即Slice层的输入规模,将其调为待测层li的输入规模;构建图G’、G”后,测量图G’、G”的执行时间Tc(G’)、Tc(G”),求图G”、G’间的时间差,即获得了待测层li的计算时间Tc(li),即Tc(li)=Tc(G”)-Tc(G’)。以上所述仅为本专利技术的具体实施方式,但本专利技术的保护范围并不局限于此。本文档来自技高网...

【技术保护点】
1.一种用于测量深度学习模型中层的计算时间的辅助图,其特征在于,该辅助图包括:输入层、输出层,以及成对的Pad层和Slice层;其中,Pad层的输出即Slice层的输入;Pad层和Slice层中间可插入待测层构建新的图;在所述新图中,Pad层的输出作为待测层的输入,待测层的输出作为Slice层的输入;Pad层和Slice层均为大小和形状可变化的层。

【技术特征摘要】
1.一种用于测量深度学习模型中层的计算时间的辅助图,其特征在于,该辅助图包括:输入层、输出层,以及成对的Pad层和Slice层;其中,Pad层的输出即Slice层的输入;Pad层和Slice层中间可插入待测层构建新的图;在所述新图中,Pad层的输出作为待测层的输入,待测层的输出作为Slice层的输入;Pad层和Slice层均为大小和形状可变化的层。2.根据权利要求1所述的辅助图,其特征在于,所述的Slice层为稳定的层。3.根据权利要求1所述的辅助图,其特征在于,Pad层能够接受很小规模的输入并输出很大规模的输出;Slice层能够接受很大规模的输入并输出很小规模的输出。4.一种测量深度学习模型中层的计算时间的方法,其特征在于,构建权利要求1-3所述的任一辅助图,记为G’;将待测层插入到所述辅助图G’的Pad层和Slice层中间,构建新的图G”;测量图G’、G”的执行时间Tc(G’)、Tc(G”),将图G”、G’间的时间差作为待测层的计算时间Tc,即Tc=Tc(G”)-Tc(G’)。5.根据权利要求4所述的测量深度学习模型中层的计算时间的方法,其特征在于,在所述的图G’中,以待...

【专利技术属性】
技术研发人员:孙军欢张骏雪
申请(专利权)人:北京瀚海星云科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1