基于强化学习的神经网络的片上核心编译映射方法及装置制造方法及图纸

技术编号：33504103 阅读：14 留言：0更新日期：2022-05-19 01:13

本发明专利技术公开了基于强化学习的神经网络的片上核心编译映射方法及装置，通过将传统映射规划问题放入强化学习框架，构造状态描述、奖励函数和行动空间，通过强化学习训练获得的策略深度网络，依次将神经元放置在片上网络的多个核心内。以通信代价、映射面积和核心内部使用率构造映射收益，并利用Actor

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的神经网络的片上核心编译映射方法及装置

[0001]本专利技术涉及计算机高性能计算领域，尤其是涉及基于强化学习的神经网络的片上核心编译映射方法及装置。

技术介绍

[0002]神经科学对人脑的研究发现，数百亿神经元通过互联可产生高度的并行计算能力，在此基础上提出的脉冲神经网络可通过脉冲编码完成信息传递来解决复杂任务。基于脉冲神经网络的神经形态芯片以高密度的片上网络组织方式模拟生物神经元的连接，实现了大规模计算的并行化。而片上网络不同核心间的信息通信方式对脉冲的产生和收发非常敏感，对网络部署结果产生的性能约束提出了极高的要求。
[0003]不同于传统编译器，面向基于脉冲传递完成推理的神经网络在片上网络的编译映射，一般被建模为约束条件下的多目标规划问题，其目标为解决芯片内所有节点间脉冲传递的总功耗（也即通讯代价），以及应用计算耗时的优化问题。由于脉冲神经网络的图连接特性，主流映射算法分为两个阶段：1）对原脉冲神经网络先进行分割，重构拓扑结构；2）为每个网络分块分配绑定至物理节点。编译的核心问题在于求解给定优化目标下的最优映射方案是一个NP
‑
Hard问题，如何在芯片的硬件约束下使用较短时间找到近似解。
[0004]工业界中目前的编译环境和框架种类丰富，多数为针对自家芯片进行的特定建模和优化算法设计。英特尔的Loihi芯片的编译器LCompiler分割图后映射至每个核中，并逐一生成二进制文件。分配算法以优化Loihi的输入映射比为目标，迭代尝试神经元的分配直到可放入给定数量的核中...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的神经网络的片上核心编译映射方法，其特征在于包括如下步骤：步骤S1：获取脉冲神经网络的拓扑结构和参数信息，脉冲神经网络包括神经元群和突触，神经元群由神经元组成，神经元之间通过突触连接；拓扑结构为具有节点和边的图结构，节点表示神经元和/或神经元群，边表示作为神经元和/或神经元群之间连接的突触；参数信息包括神经元和突触连接中的特征数据；步骤S2：对部署脉冲神经网络的芯片，获取其片上网络计算核心矩阵的描述信息，计算核心用于分配神经元进行计算，描述信息包括计算核心的规格，计算核心在片上网络的空间位置、不同计算核心的通信连接关系；步骤S3：通过已分配的计算核心在片上网络的空间位置、已分配的神经元连接情况、当前待分配的神经元及其与其他神经元之间的连接情况，构建初始化映射状态；步骤S4：将映射状态输入已完成训练的强化学习策略神经网络，从神经网络的输出，获得当前待分配神经元分配到不同计算核心空间位置的映射行动的概率分布；步骤S5：选取概率分布中，概率最大的计算核心空间位置作为当前神经元的放置位置，并将其填充至对应计算核心的数字存储空间中；步骤S6：重复上述步骤，直至完成所有神经元的放置，得到完整的脉冲神经网络到芯片的片上网络计算核心矩阵的全部映射。2.根据权利要求1所述的基于强化学习的神经网络的片上核心编译映射方法，其特征在于：所述步骤S4中，强化学习策略神经网络的训练包括如下步骤：步骤S4.1：初始化，包括确定训练样本的数量；步骤S4.2：执行步骤S4.3至步骤S4.7，直至达到训练样本数量；步骤S4.3：随机构造脉冲神经网络的神经元和突触连接，随机给定包含至少N个计算核心的矩阵区域；步骤S4.4：根据当前已分配的计算核心空间位置、已分配的神经元连接、当前需分配的神经元及其与其他神经元之间的连接构成的特征向量，获得映射状态S；步骤S4.5：将映射状态S输入策略神经网络，获得输出映射行动A，并将对应的神经元放置于映射行动A指定的计算核心空间位置，并获得行动后映射状态S
’ꢀ
和对应的映射收益R；步骤S4.6：分别将映射状态S和行动后映射状态S
’
，输入评价神经网络并获得时间差分误差，根据整体的映射收益R，采用误差反传，分别更新策略神经网络的权重和评价神经网络的权重；步骤S4.7：使用行动后映射状态S
’ꢀ
替代映射状态S，继续步骤S4.4至步骤S4.6，直至完成所有神经元分配。3.根据权利要求2所述的基于强化学习的神经网络的片上核心编译映射方法，其特征在于：所述步骤S4.5中，映射行动A是将神经元分配至一个未被占据的计算核心空间位置，若未完成所有神经元分配时，映射行动的映射收益为0；若全部分配完成时，通过计算核心的内部代价、计算核心的通信代价、计算核心所占区域的几何面积，及是否满足约束条件的收益，构建映射行动的映射收益R；所述计算核心的内部代价，包括计算核心内未被利用的数字存储空间和计算核心中不同数字存储区域的均衡程度；
所述计算核心通信代价，包括每个计算核心在单位时间内接收和发送的脉冲包数量、每个脉冲包在片上的传递路径长度；所述计算核心所占区域的几何面积，对于计算核心网格上，构造一个最小的包含所有映射使用到的计算核心的矩形闭包，该矩形闭包内包含的所有核心数量即为核心所占区域的几何面积；所述约束条件的收益，是硬件约束要求脉冲神经网络的输入层和输出层需要排布在网格的指定位置和/或自定义的偏好约束。4.根据权利要求3所...

【专利技术属性】
技术研发人员：何煜坤，李莹，吕攀，章明，孙世春，邓水光，潘纲，马德，齐勃，金孝飞，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人