【技术实现步骤摘要】
处理神经网络模型的方法、装置和电子设备
[0001]本申请涉及计算机
,具体涉及一种处理神经网络模型的方法、装置和电子设备。
技术介绍
[0002]某些场景下,比如从模型训练阶段到模型部署阶段,模型可能需要从一种模型框架转换到另一种模型框架。该转换过程中,如果转换后的模型的张量数据格式与转换前的模型的张量数据格式不同,那么转换过程中涉及张量数据格式的转换。
[0003]相关技术中,张量数据格式的转换可以通过引入转置(transpose)操作来实现,不过,这种方式导致转换后的模型部署之后,模型的计算效率较低。
技术实现思路
[0004]有鉴于此,本申请实施例致力于提供一种处理神经网络模型的方法、装置和电子设备。下面对本申请涉及的各个方面进行介绍。
[0005]第一方面,提供了一种处理神经网络模型的方法,包括:获取神经网络模型,所述神经网络模型用于执行多种神经网络操作,所述多种神经网络操作包括第一类转置操作和第二类转置操作,所述第一类转置操作用于将第一张量数据格式转换为第二张量数据格式,所述 ...
【技术保护点】
【技术特征摘要】
1.一种处理神经网络模型的方法,其特征在于,所述方法包括:获取神经网络模型,所述神经网络模型用于执行多种神经网络操作,所述多种神经网络操作包括第一类转置操作和第二类转置操作,所述第一类转置操作用于将第一张量数据格式转换为第二张量数据格式,所述第二类转置操作用于将所述第二张量数据格式转换为所述第一张量数据格式;根据所述第一类转置操作和所述第二类转置操作中的可相互抵消的转置操作,简化所述神经网络模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一类转置操作和所述第二类转置操作中的可相互抵消的转置操作,简化所述神经网络模型,包括:从所述神经网络模型的静态图结构中搜索配对节点,所述配对节点为所述静态图结构中的用于执行转置操作的节点中的相邻节点,所述配对节点中的一个节点用于执行所述第一类转置操作,所述配对节点中的另一个节点用于执行所述第二类转置操作,且所述配对节点的转置操作可相互抵消;响应于搜索到所述配对节点,删除所述神经网络模型中的与所述配对节点对应的操作符。3.根据权利要求2所述的方法,其特征在于,所述配对节点包括第一节点和第二节点,所述第一节点位于所述第二节点的上游,所述静态图结构还包括用于执行卷积操作的第三节点和第四节点,所述第一节点位于所述第三节点的输出端,所述第二节点位于所述第四节点的输入端,且所述第一节点和所述第二节点之间不存在分支节点。4.根据权利要求3所述的方法,其特征在于,在所述从所述神经网络模型的静态图结构中搜索配对节点之前,所述方法还包括:从所述神经网络模型的静态图结构中搜索第一分支结构,所述第一分支结构包括一分支节点,所述第一分支结构的各个输入路径均包括用于执行所述第一类转置操作的节点,且所述各个输入路径上的用于执行所述第一类转置操作的节点与所述分支节点之间不存在其他分支节点;将所述各个输入路径上的用于执行所述第一类转置操作的节点删除,并在所述分支节点的各个输出端添加用于执行所述第一类转置操作的节点。5.根据权利要求2
‑
4中任一项所述的方法,其特征在于,所述神经网络模型的静态图结构的有向边具有边属性,所述边属性用于指示所述有向边所指向的节点是否用于处理张量数据,所述从所述神经网络模型的静态图结构中搜索配对节点,包括:根据所述静态图结构中的有向边的边属性,从处理张量数据的节点中搜索所述配对节点。6.根据权利要求1
‑
4中任一项所述的方法,其特征在于,所述方法还包括:删除所述神经网络模型中的用于执行所述第二类转置操作的第一个操作符;将所述神经网络模型支持的输入数据格式更改为所述第一张量数据格式。7.根据权利要求1
‑
4中任一项所述的方法,其特征在于,所述方法还包括:删除所述神经网络模型的用于执行所述第一类转置操作的最后一个操作符;将所述神经网络模型支持的输出数据格式更改为所述第一张量数据格式。
8.根据权利要求1
‑
4中任一项所述的方法,其特征在于,所述神经网络模型是模型转换后得到的神经网络模型。9.一种处理神经网络模型的装置,其特征在于,所述装置包括:获取模块,用于获取神经网络模型,所述神经网络模型用于执行多种神经网络操作,所述多种神经网络操作包括第一类转置操作和第二类转置操作,所述第一类转置操作用于将第一张量数据格式转换为第二张...
【专利技术属性】
技术研发人员:董旭炯,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。