【技术实现步骤摘要】
一种面向神经网络处理的全局广播数据输入电路
本专利技术属于集成电路
,具体涉及一种面向神经网络处理的全局广播数据输入电路。
技术介绍
神经网络算法在计算机视觉、语音识别以及机器人控制等重要领域都得到了良好应用,但是各类应用也对神经网络算法的精度和复杂度不断提出更高的要求,导致算法的实现面临一系列挑战性问题。最近的神经网络处理器架构研究表明,基于阵列并行的空间型处理器架构,搭配行固定数据流策略,然后搭配特定的数据传输通路,能够很好的利用神经网络算法本身内部的高并行性和高复用度,从而大大减少数据的访存次数,提升处理器整体能效比。数据传输通路是存储系统与卷积运算阵列完成数据交互的重要媒介,数据传输通路的硬件实现关键在于如何高并发传输数据的同时减少因带宽带来的面积开销和功耗开销。对于高并发数据而言,可以将输入数据直接发送到卷积运算阵列中所有的运算单元,随着卷积运算阵列规模的增大,这种直接发送的方法带来的带宽开销会很高。另一种方法是采用两级总线的形式,对数据通路进行切割,对两级总线来说,带宽开销相对较小。这种两级总线的形 ...
【技术保护点】
1.一种面向神经网络处理的全局广播数据输入电路,其特征在于,结构包括顶层模块、水平总线模块、垂直总线模块和广播发射模块;其中:/n所述顶层模块,用于接收来自存储系统的数据包,根据数据包内部信号自动记录数据接收个数以及标识号数组的自动切换;具体而言,顶层模块根据外部控制信号自动计算单个卷积层的数据发送次数,并且记录已接收数据的行数,保证数据发送次数的准确度,并向广播发射单元发送ID数组的切换信号,保证数据的有序发送;所述顶层模块的输入数据为数据包和数据标签:数据包是输入数据数组,每个数据包内含有8个8-bit的输入数据、数据数值对应的掩码以及卷积行结尾信号;数据标签包含行标签 ...
【技术特征摘要】
1.一种面向神经网络处理的全局广播数据输入电路,其特征在于,结构包括顶层模块、水平总线模块、垂直总线模块和广播发射模块;其中:
所述顶层模块,用于接收来自存储系统的数据包,根据数据包内部信号自动记录数据接收个数以及标识号数组的自动切换;具体而言,顶层模块根据外部控制信号自动计算单个卷积层的数据发送次数,并且记录已接收数据的行数,保证数据发送次数的准确度,并向广播发射单元发送ID数组的切换信号,保证数据的有序发送;所述顶层模块的输入数据为数据包和数据标签:数据包是输入数据数组,每个数据包内含有8个8-bit的输入数据、数据数值对应的掩码以及卷积行结尾信号;数据标签包含行标签和列标签;
所述垂直总线模块,用于接收所述顶层模块译码发送的数据,包括掩码、ID切换信号和数据标签,并对这些数据进行复制,再发送到连接该模块和水平总线模块间的所有广播发射模块;所述垂直总线模块在复制时也产生数据包有效信号Valid,并发送到连接该模块和水平总线模块间的所有广播发射模块;
所述水平总线模块,用于接收垂直总线模块和水平总线模块间的广播发射模块发送的数据,包括掩码、ID切换信号和列标签,并对这些数据进行复制,再发送到连接该模块和运算单元之间的所有广播发射模块;所述水平总线模块在复制时也产生数据包有效信号Valid,并发送到连接该模块和运算单元之间的所有广播发射模块;
所述广播发射单元模块分为两种:一种位于垂直总线模块和水平总线模块之间,另一种位于水平总线模块和运算单元之间;前者根据垂直总线模块发送的ID切换信号选择对应的行标签,将该行标签与内部的行标识号数值进行比较,如果两者匹配,以及Valid和运算单元的输入先进先出队列非空信号ready均为高电平时,经过多路选择开关Mux,将数据、掩码、ID切换信号和列标签发送到与之连接的水平总线,否则屏蔽相关输出;后者根据水平总线模块发送的ID切换信号选择对应的列标签,将列标签与内部的列标识号数值进行比较,如果两者匹配,以及Valid和运算单元的输入...
【专利技术属性】
技术研发人员:韩军,张权,张永亮,曾晓洋,
申请(专利权)人:复旦大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。