【技术实现步骤摘要】
一种支持多精度计算及动态配置的向量处理器及处理方法
[0001]本申请涉及集成电路及通信
,特别涉及一种支持多精度计算及动态配置的向量处理器及处理方法。
技术介绍
[0002]神经网络模型中通常都包括大量的网络层,每一个网络层都存在权重矩阵与激活矩阵之间的卷积操作,其中权重矩阵中包含大量的权重数据,激活矩阵中包含大量的激活数据。在进行卷积操作时,一般会将卷积操作转化成矩阵乘法,然后使用矩阵乘法处理器进行计算,进而获得卷积操作的结果。
[0003]矩阵乘法处理器通常包括多个基本运算单元,这些基本运算单元排布成脉动阵列,多个权重数据和激活数据在时钟信号的控制下广播至脉动阵列中,整个矩阵乘法运算流程通过控制信号控制每一个基本运算单元不断的对接收到的权重数据和激活数据进行乘法累加运算实现。
[0004]随着深度神经网络的发展,矩阵乘加计算逐渐成为处理器重点关注的计算部分。现如今的矩阵乘加计算大多数利用算术逻辑运算单元实现,算术逻辑单元每周期只能进行单个固定宽度的数据进行计算,无法充分利用矩阵乘加计算的计算能力。 ...
【技术保护点】
【技术特征摘要】
1.一种支持多精度计算及动态配置的向量处理器,其特征在于,包括:控制模块(100),所述控制模块(100)用于接收外部传入的操作指令,以及对操作指令进行解析,得到向量计算指令和向量存储加载指令,以及确定所述向量计算指令发送的功能单元;加载存储模块(300),所述加载存储模块(300)用于根据所述向量存储加载指令,从外部加载待处理数据;扩展通道模块(200),所述扩展通道模块(200)包括通道存储单元(201)和脉动阵列加速单元(202a),所述通道存储单元(201)用于存储所述待处理数据,所述脉动阵列加速单元(202a)用于根据所述向量计算指令从所述通道存储单元(201)中获取对应数据进行向量之间的计算,并将计算结果返回所述通道存储单元(201)进行存储;所述通道存储单元(201)中存储的计算结果通过所述加载存储模块(300)向外部传输。2.根据权利要求1所述的支持多精度计算及动态配置的向量处理器,其特征在于:所述控制模块(100)包括指令分发单元(101)和主定序单元(102),所述指令分发单元(101)接收外部传入的操作指令,对操作指令进行处理后识别出操作指令的种类和对应的功能单元并将操作指令传入所述主定序单元(102),所述主定序单元(102)向所有功能单元广播指令,并监控指令的运行状态。3.根据权利要求1所述的支持多精度计算及动态配置的向量处理器,其特征在于:所述扩展通道模块(200)包括通道指令定序单元(203)、所述通道存储单元(201)和若干计算处理单元(202),所述计算处理单元(202)包括所述脉动阵列加速单元(202a)。4.根据权利要求3所述的支持多精度计算及动态配置的向量处理器,其特征在于:所述通道存储单元(201)包括向量寄存器文件(201a)和操作数队列(201b),所述向量寄存器文件(201a)用于提供功能单元的操作数并吸收其结果,所述操作数队列(201b)连接所述计算处理单元(202)和所述向量寄存器文件(201a),用于分配各个所述计算处理单元(202)的操作数。5.根据权利要求4所述的支持多精度计算及动态配置的向量处理器,其特征在于:所述向量寄存器文件(201a)包括若干存储体和仲裁单元(201a
‑
2),所述存储体为单端口,位宽设为64位,每个所述向量寄存器文件(...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。