【技术实现步骤摘要】
神经网络结构拆分方法及装置、映射方法、电子设备、介质
[0001]本公开涉及人工智能
,特别涉及一种神经网络结构拆分方法及装置、映射方法、电子设备、介质。
技术介绍
[0002]众核架构是提高程序运行并行度、加速神经网络执行的常见芯片架构。基于众核架构设计的众核芯片包括多个功能核组,每个功能核组包括多个功能核,每个功能核均可以执行计算任务。神经网络的计算任务被拆分成不同的子任务,再通过时空映射方式被分配到众核芯片中多个不同的功能核组中并行执行。这些功能核组之间按照流水的方式连续地处理输入数据,使得众核芯片具有很高的执行吞吐率。
技术实现思路
[0003]本公开提供一种神经网络结构拆分方法及装置、映射方法、电子设备、介质。
[0004]第一方面,本公开提供了一种神经网络结构拆分方法,包括:
[0005]获取神经网络中各结点在众核芯片上执行的工作负载数据;所述众核芯片包括多个功能核组,每个所述功能核组包括一个或多个功能核;
[0006]基于各所述结点对应的工作负载数据对所述神经网络中的所述结点进行拆分,获得多个子结构;其中,每个所述子结构对应分配一个所述功能核组。
[0007]第二方面,本公开提供了一种神经网络映射方法,包括:
[0008]通过本公开提供的任意一项所述的神经网络结构拆分方法对所述神经网络进行拆分,获得多个子结构;
[0009]将所述多个子结构分别映射至众核芯片中对应的功能核组中。
[0010]第三方面,本公开提供了一种神经网络结 ...
【技术保护点】
【技术特征摘要】
1.一种神经网络结构拆分方法,其特征在于,包括:获取神经网络中各结点在众核芯片上执行的工作负载数据;所述众核芯片包括多个功能核组,每个所述功能核组包括一个或多个功能核;基于各所述结点对应的工作负载数据对所述神经网络中的所述结点进行拆分,获得多个子结构;其中,每个所述子结构对应分配一个所述功能核组。2.根据权利要求1所述的神经网络结构拆分方法,其特征在于,所述基于各所述结点对应的工作负载数据对所述神经网络中的所述结点进行拆分,获得多个子结构之前,还包括:对所述众核芯片内的功能核进行分组,每个分组对应一个所述功能核组;其中,所述功能核组的数量预先设定;所述基于各所述结点对应的工作负载数据对所述神经网络中的所述结点进行拆分,获得多个子结构,包括:按照所述分组遍历各所述结点对应的工作负载数据,对所述神经网络中的所述结点进行拆分,获得多个子结构。3.根据权利要求2所述的神经网络结构拆分方法,其特征在于,所述获取神经网络中各结点在众核芯片上执行的工作负载数据,包括:依次遍历神经网络中各所述结点的网络参数,并将各所述结点的网络参数转换为众核芯片上执行的工作负载数据;其中,所述结点的网络参数为算法中函数的配置参数;所述工作负载数据包括计算量、动态数据存储量、静态数据存储量和路由量中的一种或多种。4.根据权利要求2所述的神经网络结构拆分方法,其特征在于,所述基于各所述结点对应的工作负载数据对所述神经网络中的所述结点进行拆分,获得多个子结构,包括:依次遍历所述神经网络中各个所述结点,判断上一拆分结点之后的第一个结点至当前结点的工作负载数据是否满足拆分条件;在满足拆分条件的情况下,将上一个拆分结点到当前结点之间的结点作为一个所述子结构。5.根据权利要求4所述的神经网络结构拆分方法,其特征在于,所述判断当前结点是否满足拆分条件,包括:统计上一个拆分结点之后的第一个结点到所述当前结点的工作负载数据;基于上一个拆分结点之后的第一个结点到所述当前结点的工作负载数据获得拆分得分;在所述拆分得分大于预设的拆分阈值的情况下,判断所述当前结点满足所述拆分条件。6.根据权利要求5所述的神经网络结构拆分方法,其特征在于,所述工作负载数据包括计算量、动态数据存储量、静态数据存储量、路由量中的一种或多种;所述拆分得分基于计算量、动态数据存储量、静态数据存储量、路由量中的一个或多个获得。7.根据权利要求5所述的神经网络结构拆分方法,其特征在于,所述工作负载数据包括计算量占比、存储利用率以及路由量占比中的一种或多种;所述拆分得分基于所述计算量占比、存储利用率、路由量占比中的一个或多个获得。8.根据权利要求7所述的神经网络结构拆分方法,其特征在于,
所述计算量占比为上一个拆分结点之后的第一个结点到所述当前结点的累积计算量与所述神经网络中的...
【专利技术属性】
技术研发人员:王冠睿,祝夭龙,张伟豪,
申请(专利权)人:北京灵汐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。