提升深度学习模型吞吐量的方法、装置、设备及可读介质制造方法及图纸

技术编号：32530929 阅读：9 留言：0更新日期：2022-03-05 11:25

本发明专利技术提供了一种提升深度学习模型吞吐量的方法、装置、设备及可读介质，该方法包括：根据需求为深度学习模型设置分层界限阈值；获取深度模型中网络结构的层数，并将深度学习模型根据分层界限阈值划分为两部分；按两部分模型的顺序依次对输入参数进行训练。通过使用本发明专利技术的方案，能够有效减少内存的使用量，能够加快模型的训练效率，能够提升深度学习模型的吞吐量。吞吐量。吞吐量。

全部详细技术资料下载

【技术实现步骤摘要】
提升深度学习模型吞吐量的方法、装置、设备及可读介质

[0001]本专利技术涉及计算机领域，并且更具体地涉及一种提升深度学习模型吞吐量的方法、装置、设备及可读介质。

技术介绍

[0002]深度学习在许多不同的应用领域取得了进展，从图像识别到语言建模，再到机器翻译和语音识别。两种趋势对这些结果至关重要——越来越大的训练数据集和越来越复杂的模型。例如，Hannun等人(2014年)使用的语音识别模型是基于5000小时的数据进行训练的，最近的声学模型是基于近12000小时的数据进行训练的(Amodei等人，2016年)，而Soltau等人(2016年)使用的数据集更大，如125000小时。Hannun等人(2014年)使用的神经网络有1100万个参数，双向RNN的参数增加到约6700万个，Amodei等人(2016年)使用的最新前向纯递归单元(GRU)模型的参数进一步增加到1.16亿个。大型模型通常需要更多的计算和内存资源进行训练。这些要求可以通过使用降低精度的表示和算法来降低。任何程序(包括神经网络训练和推理)的性能(速度)都受到三个因素之一的限制：算术带宽、内存带宽或延迟。降低精度解决了其中两个限制。通过使用更少的位来表示值，对于相同数量的数学运算可以降低内存带宽压力，读取/写入内存的字节更少。由于某些处理器提供更高的吞吐量以降低计算精度，因此计算时间也可以降低。例如，在最近的GPU中，半精度吞吐量比单精度高2到8倍。除了提高速度外，精度降低的格式还可以减少训练所需的内存量。
[0003]深度神经网络(DNN)在...

【技术保护点】

【技术特征摘要】
1.一种提升深度学习模型吞吐量的方法，其特征在于，包括以下步骤：根据需求为深度学习模型设置分层界限阈值；获取所述深度模型中网络结构的层数，并将所述深度学习模型根据分层界限阈值划分为两部分；按两部分模型的顺序依次对输入参数进行训练。2.根据权利要求1所述的方法，其特征在于，获取所述深度模型中网络结构的层数，并将所述深度学习模型根据分层界限阈值划分为两部分包括：获取所述深度模型中网络结构的层数；将第一层网络结构到所述分层界限阈值对应的网络结构划分为第一部分模型；将所述分层界限阈值对应的网络结构到最后一层网络结构划分为第二部分模型。3.根据权利要求1所述的方法，其特征在于，分层界限阈值为1至所述深度学习模型中网络结构层数之间的整数。4.根据权利要求1所述的方法，其特征在于，按两部分模型的顺序依次对输入参数进行训练包括：使用第一部分模型对输入参数进行训练后得到训练结果；使用第二部分模型对所述训练结果进行训练后得到最终结果。5.一种提升深度学习模型吞吐量的装置，其特征在于，所述装置包括：设置模块，所述设置模块配置为根据需求为深度学习模型设置分层界限阈值；划分模块，所述划分模块配置为获取所述深度模型中网络结构的层数，并将所...

【专利技术属性】
技术研发人员：辛永欣，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人