一种应用于神经网络加速器的多核同步管理系统技术方案

技术编号：41109154 阅读：2 留言：0更新日期：2024-04-25 14:02

本发明专利技术涉及神经网络加速器，具体涉及一种应用于神经网络加速器的多核同步管理系统，串并转换单元，根据自定义字头开始符识别数据包中同步信息串行码字，并发送至多核同步集总处理单元；多核同步集总处理单元，接收串并转换单元发送的同步信息串行码字，解码出Inform与Wait字段，通过查找表对照Inform与Wait信息识别出同步确认信息，并发送至多核同步单元；多核同步单元，位于各神经网络处理器内核中，与多核同步集总处理单元配合工作，负责打包转发各神经网络处理器内核的多核同步请求；本发明专利技术提供的技术方案能够有效克服现有技术所存在的无法在有效协同处理器核心的同时便于处理器核心优化扩展的缺陷。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及神经网络加速器，具体涉及一种应用于神经网络加速器的多核同步管理系统。

技术介绍

1、神经网络加速器指专门针对深度学习应用进行设计的高性能硬件电路。为有效提升神经网络加速器的计算性能，通常采用众核方案，由多个彼此独立的神经网络处理器核心构成分立计算节点，并行完成计算任务。

2、在计算任务的并行分配中，需要协调多层次深度学习计算循环展开方式处理单元与支持多种计算类型的神经网络计算核心的执行顺序，充分挖掘数据流复用潜力以提高处理器效率。

3、为了解决神经网络加速器中不同处理器核心之间的有效协同问题，现有技术方案通常采用同步环或硬件信号直连的方式。在采用同步环的设计中，通过在各处理器核心之间顺序传递同步信息实现各个核心执行状态的对齐，这种方式要求每个核心中维护一套独立的复杂同步信息处理单元，且延迟时间长，不利于处理器核心数量的扩展；硬件信号直连的方式处理的同步信息有限，不能满足处理器核内多层级处理子单元的复杂同步需求。

技术实现思路

1、(一)解决的技术问题

2、针对现有技术所存在的上述缺点，本专利技术提供了一种应用于神经网络加速器的多核同步管理系统，能够有效克服现有技术所存在的无法在有效协同处理器核心的同时便于处理器核心优化扩展的缺陷。

3、(二)技术方案

4、为实现以上目的，本专利技术通过以下技术方案予以实现：

5、一种应用于神经网络加速器的多核同步管理系统，包括串并转换单元、多核同步集总处理单元和多核同步单元；

6、串并转换单元，根据自定义字头开始符识别数据包中同步信息串行码字，并发送至多核同步集总处理单元；

7、多核同步集总处理单元，接收串并转换单元发送的同步信息串行码字，解码出inform与wait字段，通过查找表对照inform与wait信息识别出同步确认信息，并发送至多核同步单元；

8、多核同步单元，位于各神经网络处理器内核中，与多核同步集总处理单元配合工作，负责打包转发各神经网络处理器内核的多核同步请求，并接收多核同步集总处理单元发送的同步确认信息。

9、优选地，当神经网络处理器内核的指令控制单元执行分发段接收到sync多核同步指令时，指令分发进入sync停顿状态，直至接收到多核同步集总处理单元发送的继续执行确认信息后才释放sync停顿状态。

10、优选地，所述sync多核同步指令进入多核同步集总处理单元并进行译码后，当指令中本核心内部指令队列中的指令执行完成后，向其他核心发送同步信号并等待其他核心的同步信号通知，只有在收到所有指定的其他核心的同步信号后本指令才执行完成，后续才允许sync多核同步指令填充至多核同步集总处理单元的指令slot中，此时即完成一轮指令触发的多核同步流程。

11、优选地，所述多核同步单元用于翻译、转发当前所在核的核间同步信息，接收多核同步集总处理单元通知给当前所在核的继续执行确认信息，并通知神经网络处理器内核释放当前多核同步停顿状态，从而恢复后续指令的执行与分发流程。

12、优选地，所述多核同步单元为多核同步集总处理单元在各神经网络处理器内核中的核间同步指令转发器，在多核同步集总处理单元与多核同步单元之间，通过串行数据以数据包形式每次传输64bit打包同步信息字段，该字段通过多核同步集总处理单元解码获得各32bit通知、等待信息，分别加入至inform、wait信息提取单元中，并根据依赖关系情况获得各神经网络处理器内核的继续执行确认信息。

13、优选地，所述多核同步集总处理单元负责控制多核同步，各通道独立维护一套状态机逻辑，包括send、wait两个状态。

14、优选地，所述神经网络处理器内核启动后处于idle状态，此时只负责接收该通道以外其他核发送的send信息，当同时接收到多个核向本核发送的send信息时，将逐一通过并串转换发送到本核，同步顺序不分先后，并记录对应核号到本地tag寄存器。

15、优选地，当神经网络处理器内核接收到sync多核同步指令时，对send、wait字段分别进行解码；

16、当send字段不为空时进入send状态，否则检查wait字段是否为空，判断是否进入wait状态；当send、wait字段均为空时，上报字段异常中断并保持idle状态。

17、优选地，处于send状态下：

18、当对应执行单元指令排空后检查wait字段，且wait字段为空时返回idle状态，不清空tag寄存器，或当tag寄存器中记录的核外通知满足wait字段请求时返回idle状态，并清空tag寄存器；

19、当对应执行单元指令排空后检查wait字段，wait字段不为空，且tag寄存器中记录的核外通知无法满足wait字段请求时进入wait状态；

20、处于wait状态下：

21、当接收到核外通知，并且tag字段满足wait字段核号要求时返回idle状态，并向指令控制单元发送sync_release请求，当接收到sync_release_confirm时确认sync多核同步指令执行完毕。

22、(三)有益效果

23、与现有技术相比，本专利技术所提供的一种应用于神经网络加速器的多核同步管理系统，对各个执行核状态通报及查询信息进行集中管理，通过自定义串行接口接收来自多个神经网络处理器内核的执行码字打包信息，在本地维护各执行核状态与查询诉求，并通过查找表根据各核查询诉求动态上报查询结果，本专利技术具体包含以下有益效果：

24、1)简化了各神经网络加速器核心的同步指令设计，有效提升了各核心性能；

25、2)采用集总式多核同步管理方法，配合位于各神经网络处理器内核中的多核同步单元，实现多核同步信息的串行转发，简化了处理器核心端同步设计，优化了处理器时序性能；

26、3)通过查找表实现了低延时的多核同步状态确认；

27、4)便于神经网络加速器芯片中处理器核心同步功能的结构简化与功能扩展。

本文档来自技高网...

【技术保护点】

1.一种应用于神经网络加速器的多核同步管理系统，其特征在于：包括串并转换单元、多核同步集总处理单元和多核同步单元；

2.根据权利要求1所述的应用于神经网络加速器的多核同步管理系统，其特征在于：当神经网络处理器内核的指令控制单元执行分发段接收到Sync多核同步指令时，指令分发进入sync停顿状态，直至接收到多核同步集总处理单元发送的继续执行确认信息后才释放sync停顿状态。

3.根据权利要求2所述的应用于神经网络加速器的多核同步管理系统，其特征在于：所述Sync多核同步指令进入多核同步集总处理单元并进行译码后，当指令中本核心内部指令队列中的指令执行完成后，向其他核心发送同步信号并等待其他核心的同步信号通知，只有在收到所有指定的其他核心的同步信号后本指令才执行完成，后续才允许Sync多核同步指令填充至多核同步集总处理单元的指令slot中，此时即完成一轮指令触发的多核同步流程。

4.根据权利要求1所述的应用于神经网络加速器的多核同步管理系统，其特征在于：所述多核同步单元用于翻译、转发当前所在核的核间同步信息，接收多核同步集总处理单元通知给当前所在核的

5.根据权利要求4所述的应用于神经网络加速器的多核同步管理系统，其特征在于：所述多核同步单元为多核同步集总处理单元在各神经网络处理器内核中的核间同步指令转发器，在多核同步集总处理单元与多核同步单元之间，通过串行数据以数据包形式每次传输64bit打包同步信息字段，该字段通过多核同步集总处理单元解码获得各32bit通知、等待信息，分别加入至Inform、Wait信息提取单元中，并根据依赖关系情况获得各神经网络处理器内核的继续执行确认信息。

6.根据权利要求1所述的应用于神经网络加速器的多核同步管理系统，其特征在于：所述多核同步集总处理单元负责控制多核同步，各通道独立维护一套状态机逻辑，包括send、wait两个状态。

7.根据权利要求6所述的应用于神经网络加速器的多核同步管理系统，其特征在于：所述神经网络处理器内核启动后处于idle状态，此时只负责接收该通道以外其他核发送的send信息，当同时接收到多个核向本核发送的send信息时，将逐一通过并串转换发送到本核，同步顺序不分先后，并记录对应核号到本地tag寄存器。

8.根据权利要求7所述的应用于神经网络加速器的多核同步管理系统，其特征在于：当神经网络处理器内核接收到Sync多核同步指令时，对send、wait字段分别进行解码；

9.根据权利要求8所述的应用于神经网络加速器的多核同步管理系统，其特征在于：处于send状态下：

...

【技术特征摘要】

1.一种应用于神经网络加速器的多核同步管理系统，其特征在于：包括串并转换单元、多核同步集总处理单元和多核同步单元；

2.根据权利要求1所述的应用于神经网络加速器的多核同步管理系统，其特征在于：当神经网络处理器内核的指令控制单元执行分发段接收到sync多核同步指令时，指令分发进入sync停顿状态，直至接收到多核同步集总处理单元发送的继续执行确认信息后才释放sync停顿状态。

3.根据权利要求2所述的应用于神经网络加速器的多核同步管理系统，其特征在于：所述sync多核同步指令进入多核同步集总处理单元并进行译码后，当指令中本核心内部指令队列中的指令执行完成后，向其他核心发送同步信号并等待其他核心的同步信号通知，只有在收到所有指定的其他核心的同步信号后本指令才执行完成，后续才允许sync多核同步指令填充至多核同步集总处理单元的指令slot中，此时即完成一轮指令触发的多核同步流程。

4.根据权利要求1所述的应用于神经网络加速器的多核同步管理系统，其特征在于：所述多核同步单元用于翻译、转发当前所在核的核间同步信息，接收多核同步集总处理单元通知给当前所在核的继续执行确认信息，并通知神经网络处理器内核释放当前多核同步停顿状态，从而恢复后续指令的执行与分发流程。

5.根据权利要求4所述的应用于神经网络加速器的多核同步管理系统...

【专利技术属性】
技术研发人员：胡海生，
申请(专利权)人：安徽芯纪元科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人