一种基于高速差分信号的芯片级联方法技术

技术编号:31153938 阅读:17 留言:0更新日期:2021-12-04 09:42
本发明专利技术提供了一种基于高速差分信号的芯片级联方法,所述方法包括:通过差分高速输入接口的高速差分总线将数据输入到总线仲裁模块,由总线仲裁模块判断数据流中的某一部分或者全部是否进入计算单元的存储模块,没有进入本计算单元的继续从差分高速输出接口发出,流向下一个计算单元;进入本计算单元的数据,交由计算引擎模块计算结果,结果数据返回存储模块中,再从差分高速输出接口发送到下一个计算单元;当计算引擎处于计算状态中并没有到达输出结果的这段时间里,该计算单元处于忙碌状态;否则处于空闲状态。否则处于空闲状态。否则处于空闲状态。

【技术实现步骤摘要】
一种基于高速差分信号的芯片级联方法


[0001]本专利技术涉及并行计算
,特别涉及一种基于高速差分信号的芯片级联方法。

技术介绍

[0002]当今社会是一个高度数字化的社会,特别是随着移动通信技术的不断发展和演进。MIPI/DVP/BT所传送的一般是普通视频流,它们也可以作为高速数据端口使用。现有技术中的常用术语包括:
[0003]PCI-Express(peripheral component interconnect express)是一种高速串行计算机扩展总线标准,PCIE属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽,主要支持主动电源管理,错误报告,端对端的可靠性传输,热插拔以及服务质量(QOS)等功能。
[0004]移动产业处理器接口(Mobile Industry Processor Interface简称MIPI)是MIPI联盟发起的为移动应用处理器制定的开放标准。MIPI是专门在高速(数据传输)模式下采用低振幅信号摆幅,针对功率敏感型应用而量身定做的。MIPI联盟定义了一套接口标准,把移动设备内部的接口如摄像头、显示屏、基带、射频接口等标准化,从而增加设计灵活性,同时降低成本、设计复杂度、功耗和EMI。由于MIPI是采用差分信号传输的,所以在设计上需要按照差分设计的一般规则进行严格的设计,关键是需要实现差分阻抗的匹配,MIPI协议规定传输线差分阻抗值为80-125欧姆。
[0005]如何有效的提高效率,有效利用差分高速数据传输实现数据在芯片级联并行计算中的作用成为亟待解决的问题。

技术实现思路

[0006]为了解决上述现有技术中存在的问题,本专利技术的目的在于:通过本专利技术的方法可以用来加速深度神经网络计算,语音智能算法计算,数学计算以及区块链计算。
[0007]为了实现上述目的,本申请提供了一种基于高速差分信号的芯片级联方法,所述方法包括:
[0008]通过差分高速输入接口的高速差分总线将数据输入到总线仲裁模块,由总线仲裁模块判断数据流中的某一部分或者全部是否进入计算单元的存储模块,没有进入本计算单元的继续从差分高速输出接口发出,流向下一个计算单元;
[0009]进入本计算单元的数据,交由计算引擎模块计算结果,结果数据返回存储模块中,再从差分高速输出接口发送到下一个计算单元;
[0010]当计算引擎处于计算状态中并没有到达输出结果的这段时间里,该计算单元处于忙碌状态;否则处于空闲状态。
[0011]所述的差分高速差分总线中的数据会同时包含下列任意一种或多种类型:
[0012]1)该数据包是计算数据,其中明确标志了接收本数据包的计算单元的ID信息,则
该数据包只会被包含该ID的计算单元总线仲裁模块接收,其他计算单元对此数据包只执行过顶传输操作;如果没有符合条件的计算单元,该数据包会传递返回计算控制模块;
[0013]2)该数据包是计算数据,但没有标志接收本数据包的计算单元的ID信息,则该数据包会被第一个空闲状态的计算单元接收,处于忙碌状态的计算单元对此数据包只执行过顶传输操作;如果没有符合条件的计算单元,该数据包会传递返回计算控制模块;
[0014]3)该数据包是结果数据;则所有计算单元对此数据包只执行过顶传输操作。
[0015]每个所述的计算单元就是一颗独立的SOC/ASIC芯片,所述芯片内置计算单元。
[0016]所述的计算单元支持MIPI/LVDS接口和SPI/I2C/UART接口。
[0017]所述的差分高速总线为MIPI总线,也可以为LVDS/BT1120高速总线。
[0018]所述方法利用高速总线协议来统一传输计算数据和结果数据,并不需要分开两条数据通路。
[0019]所述的计算控制模块由FPGA或者ASIC芯片实现。
[0020]本专利技术的优势在于:采用本方法,以深度神经网络计算为例,计算单元中内置CNN加速引擎,每个计算单元提供8Tops的算力,通过16单元的级联,就可以达到共计整板128T的算力。用这种方式,比GPGPU或者FPGA有更好的灵活性、更高的性价比和更好的能耗比。
附图说明
[0021]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,并不构成对本专利技术的限定。
[0022]图1是本专利技术方法应有于的系统的结构示意图。
[0023]图2是本专利技术方法涉及的环型数据通路的图示。
[0024]图3是本专利技术方法的流程框图。
具体实施方式
[0025]本专利技术的系统结构,如图1所示。该系统由以下几个部分组成:计算控制模块,计算阵列,环型数据通路和星型数据通路。
[0026]计算控制模块:由FPGA或者ASIC芯片实现,该模块支持PCIE接口,MIPI/LVDS等接口,SPI/I2C/UART等接口。该模块的流程是:1.通过星型数据通路,2.给计算阵列的每个计算单元配置工作模式,3.从PCIE接收待计算数据,4.通过环型数据接口把数据发送到计算阵列的第一个计算单元,5.从技术阵列的最后一个技术单元的环型数据接口接收计算结果数据,6.通过PCIE把结果数据和反馈数据输出到系统外
[0027]计算阵列:计算阵列是若干个计算单元的集合。每个计算单元就是一颗独立的SOC/ASIC芯片,该芯片内置高性能的计算单元,并支持MIPI/LVDS等接口和SPI/I2C/UART等接口。计算单元之间,用高速串行差分接口相连,统一接口传输数据,输入数据和输出数据都通过该接口总线传输。计算阵列内包含计算单元的数量根据应用的强度可以灵活选择,例如:4个计算单元组成一个技术阵列,16个计算单元组成一个技术阵列,32个计算单元组成一个技术阵列等。但在板卡的实现上,由于PCB面积的限制,同一个计算阵列无法无限量增加计算单元。
[0028]环型数据通路:环型数据通路是连接计算控制模块与每个计算单元的高速数据接
口。计算模块内部,每个计算单元之间的接口连接属于环型数据通路的一部分;计算控制模块与第一个计算单元之间的接口连接属于环型数据通路的一部分;计算控制模块与最后一个计算单元之间的接口连接也属于环型数据通路的一部分。环型数据通路的数据吞吐速率很高,其中一些实现技术是通过MIPI或者LDVS等差分高速接口。以MIPI接口为例,环型数据通路的技术细节如图2所示。
[0029]该结构中,MIPI-input高速差分总线数据输入仲裁模块,由仲裁模块判断数据流中的某一部分或者全部是否进入本单元的memory,没有进入本单元的继续从MIPI-output中发出,流向下一个计算单元。进入本单元的数据,交由计算引擎计算结果,结果数据返回memory中,再从MIPI-output发送到下一个计算单元。当计算引擎处于计算状态中并没有到达输出结果的这段时间里,该计算单元处于busy状态;否则处于idle状态。
[0030]在该实例中,MIPI高速差分总线中的数据会同时包含下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于高速差分信号的芯片级联方法,其特征在于,所述方法包括:通过差分高速输入接口的高速差分总线将数据输入到总线仲裁模块,由总线仲裁模块判断数据流中的某一部分或者全部是否进入计算单元的存储模块,没有进入本计算单元的继续从差分高速输出接口发出,流向下一个计算单元;进入本计算单元的数据,交由计算引擎模块计算结果,结果数据返回存储模块中,再从差分高速输出接口发送到下一个计算单元;当计算引擎处于计算状态中并没有到达输出结果的这段时间里,该计算单元处于忙碌状态;否则处于空闲状态。2.根据权利要求1所述的一种基于高速差分信号的芯片级联方法,其特征在于,所述的差分高速差分总线中的数据会同时包含下列任意一种或多种类型:1)该数据包是计算数据,其中明确标志了接收本数据包的计算单元的ID信息,则该数据包只会被包含该ID的计算单元总线仲裁模块接收,其他计算单元对此数据包只执行过顶传输操作;如果没有符合条件的计算单元,该数据包会传递返回计算控制模块;2)该数据包是计算数据,但没有标志接收本数据包的计算单元的ID信息,则该数据包会被第...

【专利技术属性】
技术研发人员:刘远
申请(专利权)人:合肥君正科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1