一种深度学习模型的高效转换方法及装置制造方法及图纸

技术编号:16819727 阅读:130 留言:0更新日期:2017-12-16 13:22
本发明专利技术实施例的深度学习模型的高效转换方法,用于解决深度学习模型开发效率和运算效率较低的技术问题。方法包括:根据通用深度学习框架建立与NPU模型对应的数据标准化框架;利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数;将所述标准参数转换为NPU模型的参数。本发明专利技术针对各通用深度学习框架的参数结构为特定处理器建立统一的数据标准化框架,根据通用深度学习框架形成的深度学习模型的参数可以利用数据标准化框架统一的数据结构形成标准数据,使得处理器进行数据解析处理的过程与深度学习模型的结构相关性大大降低,使得处理器处理过程的开发与深度学习模型的开发可以有效分离。还包括相应的高效转换装置。

An efficient transformation method and device for a depth learning model

The efficient conversion method of the depth learning model of the embodiment of the invention is used to solve the technical problems of the development efficiency and the low operational efficiency of the depth learning model. The method includes: according to the general framework of deep learning and corresponding NPU model data standardization framework; using the data standardization framework will deep learning model parameters into the data standardization framework standard parameters; the standard parameter transformation parameters for the NPU model. The frame of the invention according to the universal standard data structure parameter of the deep learning framework for processor specific parameters according to the establishment of a unified learning model general deep learning framework for the formation of the depth can form the standard data using a unified data structure data standardization framework, so that the processor structure correlation data analysis process and deep learning model greatly to reduce the development, development and deep learning model so that the processor can effectively separate process. It also includes the corresponding efficient conversion device.

【技术实现步骤摘要】
一种深度学习模型的高效转换方法及装置
本专利技术涉及深度学习框架的数据处理,特别涉及一种深度学习模型的高效转换方法及装置。
技术介绍
在深度学习
,通常利用如Caffe、TensorFlow和Torch等通用深度学习框架定义海量数据处理和分析的深度学习模型,深度学习模型的训练和数据分析需要大量的计算资源。由于不同的通用深度学习框架对数据信息的存储方式和解析方式存在较大差异,同时受限于处理器的硬件结构差异,导致深度学习模型数据处理和数据调度过程往往不能与处理器结构特点相适应,降低了处理器的运算效率。例如在现有技术方案中,直接把深度学习模型转换成神经网络处理器(NPU)的数据处理模型时需要依靠相应的转换工具,转换工具的开发需要开发人员熟悉深度学习框架的同时还要非常熟悉神经网络处理器的硬件执行特点,设计难度非常大。不采用良好的转换工具直接在神经网络处理器上运行深度学习模型,深度学习模型的通用性会成为神经网络处理器的障碍,造成执行效率低下。
技术实现思路
有鉴于此,本专利技术实施例提供了一种深度学习模型的高效转换方法及装置,用于解决深度学习模型开发效率和运算效率较低的技术问题。本专利技术的深度学习模型的高效转换方法,包括:根据通用深度学习框架建立与NPU模型对应的数据标准化框架;利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数;将所述标准参数转换为NPU模型的参数。本专利技术的深度学习模型的高效转换装置,包括:数据标准化框架生成模块,用于根据通用深度学习框架建立与NPU模型对应的数据标准化框架;标准数据生成模块,用于利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数;数据转换模块,用于将所述标准数据转换为处理器数据。本专利技术的深度学习模型的高效转换装置,包括存储介质,存储介质中包括:数据标准化框架生成模块,用于根据通用深度学习框架建立与NPU模型对应的数据标准化框架;标准数据生成模块,用于利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数;数据转换模块,用于将所述标准数据转换为处理器数据。本专利技术的深度学习模型的高效转换方法及装置针对各通用深度学习框架的参数结构为NPU处理器模型建立统一的数据标准化框架,根据通用深度学习框架形成的深度学习模型的参数可以利用数据标准化框架统一的数据结构形成标准参数,使得NPU处理器进行数据解析处理的过程与深度学习模型的结构相关性大大降低,使得NPU处理器处理过程(如微代码编程)的开发与深度学习模型的开发可以有效分离,避免了转换工具带来的开发难度。标准参数的数据结构可以通过合理转换进一步优化形成与NPU处理器的数据结构更适配的NPU处理器模型的参数,实现NPU处理器处理过程的早期优化。附图说明图1为本专利技术实施例深度学习模型的高效转换方法的流程图。图2为本专利技术实施例深度学习模型的高效转换方法的数据处理流程图。图3为本专利技术实施例深度学习模型的高效转换方法中建立深度学习模型的流程图。图4为本专利技术实施例深度学习模型的高效转换方法中建立数据标准化框架的流程图。图5为本专利技术实施例深度学习模型的高效转换方法中形成标准参数的流程图。图6为本专利技术实施例深度学习模型的高效转换方法中形成标准参数的一种深度学习模型的结构示意图。图7为本专利技术实施例深度学习模型的高效转换方法中形成处理器数据的流程图。图8为本专利技术实施例深度学习模型的高效转换装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。附图中的步骤编号仅用于作为该步骤的附图标记,不表示执行顺序。本专利技术实施例深度学习模型的高效转换方法利用通用深度学习框架建立的数据标准化框架将深度学习模型进行数据结构转换,形成与NPU处理器模型相适应的标准参数,利用NPU处理器模型对标准参数进行适应硬件处理的进一步优化处理形成处理器模型的参数。图1为本专利技术实施例深度学习模型的高效转换方法的流程图。如图1所示包括:步骤200:根据通用深度学习框架建立与NPU模型对应的数据标准化框架。NPU处理器根据处理器硬件特点具有固定模型的数据结构,处理器进行数据处理过程中通过固定的数据结构运用参数进行微代码处理。步骤300:利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数。步骤40:将标准参数转换为NPU模型的参数。本专利技术实施例的深度学习模型的高效转换方法通过数据标准化框架建立不同通用深度学习框架与NPU处理器模型数据结构的映射规则,深度学习模型基于不同通用深度学习框架形成,数据标准化框架保证深度学习模型的具体描述参数可以转换为适配NPU处理器硬件性能的标准参数,极大简化了深度学习模型和处理器数据模型间数据传递的开发难度。图2为本专利技术实施例深度学习模型的高效转换方法的数据处理流程图。如图2所示包括:步骤100:根据通用深度学习框架建立深度学习模型。每种通用深度学习框架都定义了本框架内的标准功能层,包括但不限于数据层、视觉层、损耗层、激励层和一般层,在不同的通用深度学习框架中主要功能层会有进一步的具体定义,例如:数据层可以定义为数据库层、内存层、数据流输入/输出层、视窗层或图像层等。视觉层可以定义为卷积层、池化层或LRN(LocalResponseNormalization)层等。损耗层可以定义为Softmax层、Hinge/Margin层或Infogain层等。激励层可以定义为ReLU(Rectified-LinearandLeaky-ReLU)层或Sigmoid层等。一般层可以定义为全连接层(InnerProduct)、分割层(Splitting)或平整层(Flattening)等。根据深度学习数据处理的逻辑过程可以利用不同数量和类型的功能层形成具有不同数据连接拓扑结构的基础深度学习模型,通过对各功能层的初始状态或运算状态进行配置,加载各功能层输入数据参数或输出数据参数,形成具有明确数据处理目的的深度学习模型。步骤200:根据通用深度学习框架建立与NPU模型对应的数据标准化框架。每个深度学习框架中的对应功能层受主要处理功能和实现方法的限定具有一部分相似参数和另一部分差异参数,功能层的参数可以用统一的数据结构进行描述和存储。描述各功能层参数的数据结构参考处理器(例如神经网络处理器)的特定类型参数形成数据标准化框架。步骤300:利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数。深度学习模型携带具体功能层结构信息、配置参数和数据参数,经过简单的数据键-值检索和赋值,可以将深度学习模型的全部信息储存在数据标准化框架中形成深度学习模型的标准参数。步骤400:根据所述NPU模型的数据结构将所述标准参数转换为所述NPU模型的参数。步骤400是步骤40的进一步具体处理过程。处理器数据结构与数据标准化框架存在映射规则,将深度学习模型的标准参数映射至处理器模型的数据结构形成处理器数据作为处理器数据处理过程的输入数据。本专利技术实施例的深度学习模型本文档来自技高网...
一种深度学习模型的高效转换方法及装置

【技术保护点】
一种深度学习模型的高效转换方法,包括:根据通用深度学习框架建立与NPU模型对应的数据标准化框架;利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数;将所述标准参数转换为NPU模型的参数。

【技术特征摘要】
1.一种深度学习模型的高效转换方法,包括:根据通用深度学习框架建立与NPU模型对应的数据标准化框架;利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数;将所述标准参数转换为NPU模型的参数。2.如权利要求1所述的深度学习模型的高效转换方法,其特征在于,所述根据通用深度学习框架建立与NPU模型对应的数据标准化框架包括:获取所述通用深度学习框架中各功能层的数据连接拓扑结构形成功能层的逻辑架构;从所述逻辑架构中获取所述各功能层的层功能类型和层参数类型;根据所述层功能类型和层配置参数类型建立所述功能层的层结构体;根据所述层功能类型和层数据参数类型建立所述功能层的数据结构体;所述层结构体和所述数据结构体形成与所述NPU模型对应的数据标准化框架。3.如权利要求2所述的深度学习模型的高效转换方法,其特征在于,所述利用所述数据标准化框架将深度学习模型的参数转换为所述数据标准化框架的标准参数包括:将所述各功能层的所述层功能类型的参数和所述层配置参数类型的参数存入所述数据标准化框架的所述层结构体;将所述各功能层的所述数据参数类型的参数存入所述数据标准化框架的所述数据结构体;通过数据标准化框架将所述层结构体和所述数据结构体中的参数形成标准参数。4.如权利要求1所述的深度学习模型的高效转换方法,其特征在于,所述将所述标准参数转换为NPU模型的参数包括:根据所述NPU模型的数据结构将所述标准参数转换为所述NPU模型的参数。5.如权利要求4所述的深度学习模型的高效转换方法,其特征在于,所述根据所述NPU模型的数据结构将所述标准参数转换为所述NPU模型的参数包括:根据所述NPU模型的层数据结构,将所述标准参数中部分功能层的层功能类型的参数和层配置参数类型的参数合并,形成所述部分...

【专利技术属性】
技术研发人员:杨敏艾国张韵东
申请(专利权)人:北京中星微电子有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1