一种支持单步调试的矩阵乘运算脉动阵列装置及调试方法制造方法及图纸

技术编号:35581609 阅读:25 留言:0更新日期:2022-11-12 16:11
本发明专利技术涉及机器学习技术领域,具体涉及一种支持单步调试的矩阵乘运算脉动阵列装置及调试方法,其中装置包括呈矩阵排列的运算核心、脉动阵列控制器、累加缓冲器和本地局部存储器,脉动阵列控制器包括北向数据加载器、西向数据整形与加载器、累加结果写回控制器、本地局部存储器访问接口和描述符管理解析模块,累加结果回写控制器与累加缓冲器连接,描述符管理解析模块接收单步调试模式设置及断点地址,若单步调试模式设置为有效,则西向数据加载到相应的断点地址时,停止加载西向数据及北向数据,并将已计算的结果输出至累加缓冲器。本发明专利技术的有益技术效果包括:支持单步调试有助于排查运算程序的异常和错误,提高神经网络模型的训练和预测效率。型的训练和预测效率。型的训练和预测效率。

【技术实现步骤摘要】
一种支持单步调试的矩阵乘运算脉动阵列装置及调试方法


[0001]本专利技术涉及机器学习
,具体涉及一种支持单步调试的矩阵乘运算脉动阵列装置及调试方法。

技术介绍

[0002]人工神经网络(Artificial Neutral Networks)通过模拟动物神经网络行为,以神经元与网络互连为基础构建数学算法模型,进行分布式信息处理,实现机器学习功能,广泛应用于语音处理、图像识别、计算机视觉、自然语言处理和交叉学科等人工智能领域。这些模型由多层神经网络组成,每层网络包含大量的卷积与矩阵乘运算,无论是训练还是推理,均需要计算机提供超高的计算能力与硬件加速架构以支持人工智能加速。
[0003]脉动阵列为二维运算结构,以数据流驱动方式实现运算加速。脉动阵列各个处理单元(Processing Element,PE)可以在相邻PE间传输数据,通过数据重用,减少对输入/输出数据的存取次数,进而降低访存带宽需求。脉动阵列可以在较小的访存带宽下实现较高的运算吞吐率,解决多数处理器面临的访存瓶颈问题,特别是在神经网络这种高密集型计算和访存的处理中应用优本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种支持单步调试的矩阵乘运算脉动阵列装置,其特征在于,包括呈矩阵排列的运算核心、脉动阵列控制器、累加缓冲器和本地局部存储器,所述脉动阵列控制器包括北向数据加载器、西向数据整形与加载器、累加结果写回控制器、本地局部存储器访问接口和描述符管理解析模块,相邻运算核心之间建立数据交换通道,所述北向数据加载器与最北一行运算核心连接,所述西向数据整形与加载器与最西一列运算核心连接,所述累加缓冲器与最南一行运算核心连接,所述累加结果回写控制器与累加缓冲器连接,所述北向数据加载器、西向数据整形与加载器、累加结果回写控制器及描述符管理解析模块均与本地局部存储器访问接口连接,所述本地局部存储器访问接口与本地局部存储器连接,所述描述符管理解析模块接收单步调试模式设置及断点地址,若单步调试模式设置为有效,则西向数据加载到相应的断点地址时,停止加载西向数据及北向数据,并将已计算的结果输出至累加缓冲器。2.根据权利要求1所述的一种支持单步调试的矩阵乘运算脉动阵列装置,其特征在于,所述运算核心包括乘法器、加法器、累加数据寄存器、北向数据影子寄存器、北向数据寄存器、北向更新使能寄存器和西向数据寄存器,所述乘法器接收北向数据和西向数据,乘法器计算北向数据和西向数据的乘积,所述加法器与乘法器及累加数据寄存器连接,所述加法器计算乘法器输出值与累加数据寄存器值的和,并输出到南侧的运算核心的累加数据寄存器,所述北向数据影子寄存器与北向数据加载器或者北侧数据调度单元的北向数据影子寄存器连接,所述北向数据寄存器与北向数据影子寄存器连接,所述北向更新使能寄存器与北向数据寄存器连接,同一行北向更新使能寄存器相互连接,同一行西向数据寄存器相互连接,所述乘法器与北向数据寄存器和西向数据寄存器连接。3.根据权利要求1或2所述的一种支持单步调试的矩阵乘运算脉动阵列装置,其特征在于,所述本地局部存储器内开设有调试模式设置寄存器和地址寄存器,所述描述符管理解析模块将单步调试模式设置及断点地址通过所述本地局部存储器访问接口写入相应的调试模式设置寄存器和地址寄存器。4.根...

【专利技术属性】
技术研发人员:赵冠一吴铁彬李峰唐勇谭弘兵
申请(专利权)人:无锡江南计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1