显存分配的方法、装置、计算设备及计算机存储介质制造方法及图纸

技术编号：20546780 阅读：32 留言：0更新日期：2019-03-09 19:41

本发明专利技术公开了一种显存分配的方法、装置、计算设备及计算机存储介质，其中，方法包括：解析加载于设备中的一个或多个深度学习算法模型的数据流动路线，得到解析结果；根据解析结果得到各个深度学习算法模型的数据流动过程中所需占用的显存块的第一数量；确定各个深度学习算法模型的数据流动过程中的第一数量的显存块的分配规则；根据各个深度学习算法模型对应的分配规则为所述深度学习算法模型分配显存块。本发明专利技术方案，根据数据流动路线的解析结果确定深度学习算法模型所需占用的显存块的数量以及该数量的显存块的分配规则，使设备中的显存可以最大程度的发挥缓存的作用，进而通过提高显存利用率来降低深度学习算法模型的工程实施成本。

全部详细技术资料下载

【技术实现步骤摘要】
显存分配的方法、装置、计算设备及计算机存储介质
本专利技术涉及计算机
，具体涉及一种显存分配的方法、装置、计算设备及计算机存储介质。
技术介绍
随着硬件技术的高速发展，目前市面上的主流硬件设备已经能满足深度学习算法的基本运行，但是在实际工业生产当中却隐含诸多问题。其中一种较典型的问题如下：大部分开源深度学习框架主要针对学术研究而开发，而对显卡的显存利用率一直不是很高，一般显卡设备无法负担以ResNet等超大规模的深度神经网络作为特征提取网络的深度学习算法对内存的需求。并且，在实际工业使用中，如果使用开源深度学习框架，比如Caffe这种通用的深度学习框架，它的硬件成本是非常昂贵的，进而造成一块显卡无法负载多个深度学习算法模型。因此，需要一种适用于工业生产的方案以克服现有的深度学习算法模型运行时显存利用率低、实施成本高的问题。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的显存分配的方法、装置、计算设备及计算机存储介质。根据本专利技术的一个方面，提供了一种显存分配的方法，其特征在于，包括：解析加载于设备中的一个或多个深度学习算法模型的数据流动路线，得到解析结果；根据解析结果得到各个深度学习算法模型的数据流动过程中所需占用的显存块的第一数量；确定各个深度学习算法模型的数据流动过程中的第一数量的显存块的分配规则；在一个或多个深度学习算法模型的运行中，根据各个深度学习算法模型对应的分配规则为所述深度学习算法模型分配显存块。根据本专利技术的另一方面，提供了一种显存分配的装置，其特征在于，包括：解析模块，适于解析加载于...

【技术保护点】
1.一种显存分配的方法，其特征在于，包括：解析加载于设备中的一个或多个深度学习算法模型的数据流动路线，得到解析结果；根据解析结果得到各个深度学习算法模型的数据流动过程中所需占用的显存块的第一数量；确定各个深度学习算法模型的数据流动过程中的第一数量的显存块的分配规则；在一个或多个深度学习算法模型的运行中，根据各个深度学习算法模型对应的分配规则为所述深度学习算法模型分配显存块。

【技术特征摘要】
1.一种显存分配的方法，其特征在于，包括：解析加载于设备中的一个或多个深度学习算法模型的数据流动路线，得到解析结果；根据解析结果得到各个深度学习算法模型的数据流动过程中所需占用的显存块的第一数量；确定各个深度学习算法模型的数据流动过程中的第一数量的显存块的分配规则；在一个或多个深度学习算法模型的运行中，根据各个深度学习算法模型对应的分配规则为所述深度学习算法模型分配显存块。2.根据权利要求1所述的方法，其特征在于，所述解析加载于设备中的一个或多个深度学习算法模型的数据流动路线图，得到解析结果进一步包括：解析加载于设备中的一个或多个深度学习算法模型的数据流动路线，得到对应各个深度学习算法模型的数据流动路线的数据流动时序，以及得到对应各个深度学习算法模型的数据流动路线的数据流动时序中的各个时刻所需占用的显存块的第二数量；所述根据解析结果得到各个深度学习算法模型的数据流动过程中所需占用的显存块的第一数量进一步包括：根据解析出的各个时刻所需占用的显存块的第二数量得到所述深度学习算法模型的数据流动过程中所需占用的显存块的第一数量。3.根据权利要求2所述的方法，其特征在于，所述根据解析出的各个时刻所需占用的显存块的第二数量得到所述深度学习算法模型的数据流动过程中所需占用的显存块的第一数量进一步包括：比较解析出的各个时刻所需占用的显存块的第二数量的数量值的大小，确定数量值最大的第二数量为所述深度学习算法模型的数据流动过程中所需占用的显存块的第一数量。4.根据权利要求2或3所述的方法，其特征在于，所述确定各个深度学习算法模型的数据流动过程中的第一数量的显存块的分配规则进一步包括：根据各个深度学习算法模型的数据流动路线和数据流动时序确定所述深度学习算法模型的数据流动过程中的第一数量的显存块的分配规则。5.根据权利要求4所述的方法，其特征在于，所述分配规则包括释放显存块的规则和/或新增显存块的规则。6.根据权利要求5所述的方法，其特征在于，在所述根据各个深度学习算法模型对应的分配规则为所述深度学习算法模型分配显存块进一步之前，所述方法还包括：设置包括多个显存块的显存池；所述根据各个深度学习算法模型对应的分配规则为所述深度学习算法模型分配显存块进一步包括：根据所述释放显存块的规则将所述深度学习算法模型已占用的显存块释放至显存池中；和/或，根据所述新...

【专利技术属性】
技术研发人员：洪伟，
申请(专利权)人：杭州比智科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人