【技术实现步骤摘要】
大数据运算加速系统
本公开涉及集成电路领域,特别是涉及一种大数据运算加速系统。
技术介绍
ASIC(ApplicationSpecificIntegratedCircuits)即专用集成电路,是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。ASIC的特点是面向特定用户的需求,ASIC在批量生产时与通用集成电路相比具有体积更小、功耗更低、可靠性提高、性能提高、保密性增强、成本降低等优点。随着科技的发展,越来越多的领域,比如人工智能、安全运算等都涉及大运算量的特定计算。针对特定运算,ASIC芯片可以发挥其运算快,功耗小等特定。同时,对于这些大运算量领域,为了提高数据的处理速度和处理能力,通常需要控制N个运算芯片同时进行工作。随着数据精度的不断提升,人工智能、安全运算等领域需要对越来越大的数据进行运算,例如:现在照片的大小一般为3-7MB,但是随着数码相机和摄像机的精度增加,照片的大小可以达到10MB或者更多,而30分钟的视频可能达到1个多G的数据。而在人工智能、安全运算等领域中要求计算速度快,时延小,因此如何提高计算速度和反应时间一直是芯片设计所要求的目标。由于ASIC芯片搭配的内存一般为64MB或者128MB,而当要处理的数据在512MB以上时,ASIC芯片要多次利用内存存取数据,多次将数据从外部存储空间中搬入或者搬出内存,降低了处理速度。同时,随着数据精度的不断提升,人工智能、安全运算等领域需要对越来越大的数据进行运算,为了存储数据一般需要给ASIC芯片配置多个存储单元,例如一块ASIC芯片要配置4块2G内存;这样N个运算芯片同时工作时,就需 ...
【技术保护点】
1.一种大数据运算加速系统,其特征在于,包括2个以上运算芯片,所述运算芯片包括N个内核core、N个数据通道(lane)和至少一个存储单元,所述数据通道(lane)包括发送接口(tx)和接收接口(rx),所述内核core和数据通道(lane)一一对应,所述内核core通过数据通道(lane)发送和接收数据;所述2个以上运算芯片通过所述发送接口(tx)和所述接收接口(rx)进行连接传输数据;所述至少一个存储单元用于分布式存储数据,运算芯片的每个内核core能够从所在运算芯片的存储单元获取数据,也能够从其他运算芯片的存储单元获取数据;其中N为大于等于4的正整数。
【技术特征摘要】
1.一种大数据运算加速系统,其特征在于,包括2个以上运算芯片,所述运算芯片包括N个内核core、N个数据通道(lane)和至少一个存储单元,所述数据通道(lane)包括发送接口(tx)和接收接口(rx),所述内核core和数据通道(lane)一一对应,所述内核core通过数据通道(lane)发送和接收数据;所述2个以上运算芯片通过所述发送接口(tx)和所述接收接口(rx)进行连接传输数据;所述至少一个存储单元用于分布式存储数据,运算芯片的每个内核core能够从所在运算芯片的存储单元获取数据,也能够从其他运算芯片的存储单元获取数据;其中N为大于等于4的正整数。2.根据权利要求1所述的系统,其特征在于,所述运算芯片的所述发送接口(tx)和所述接收接口(rx)为serdes接口,所述运算芯片之间通过serdes接口进行通信。3.根据权利要求1或2所述的系统,其特征在于,所述数据通道(lane)进一步包括接收地址判断单元、发送地址判断单元;接收地址判断单元一端连接于接收接口(rx),接收地址判断单元另一端连接于内核core;发送地址判断单元一端连接于发送接口(tx),发送地址判断单元另一端连接于内核core;接收地址判断单元和发送地址判断单元相互连接。4.根据权利要求3所述的系统,其特征在于,接收接口(rx)接收相邻一侧运行芯片发送的数据帧,将所述数据帧发送给接收地址判断单元,接收地址判断单元将所述数据帧发送给内核core,同时将所述数据帧发送给发送地址判断单元;发送地址判断单元接收所述数据帧,将所述数据帧发送给发送接口(tx),发送接口将所述数据帧发送给相邻另一侧运行芯片。5.根据权利要求3所述的系统,其特征在于,内核core产生数据帧,将所述数据帧发送给发送地址判断单元,发送地址判断单元将所述数据帧发送给发送接口(tx),发送接口(tx)将所述数据帧发送给相邻一侧的运行芯片。6.根据权利要求3所述的系统,其特征在于,所述接收地址判断单元和发送地址判断单元通过先进先出存储器进行相互连接。7.根据权利要求1或2所述的系统,其特征在于,所述存储单元包括多个存储器,所述多个存储器连接到至少一个存储控制单元;所述至少一个存储控制单元用于控制所述多个存储器的数据读取或者存储。8.根据权利要求7所述的系统,其特征在于,所述存储器包括至少两个存储子单元和存储控制子单元;存储控制子单元通过接口与所述至少一个存储控制单元中的每一个连接,所述存储控制子单元用于控制所述至少两个存储子单元的数据读取或者存储。9.根据权利要求8所述的系统,其特征在于,所述存储子单元为SRAM存储器。10.根据权利要求1或2所述的系统,其特征在于,所述2个以上运算芯片连接成环形。11.根据权利要求1或2所述的系统,其特征在于,所述2个以上运算芯片不连接外部存储单元。12.根据权利要求1或2所述的系统,其特征在于,所述运算芯片进一步包括第一数据接口(130)与外部主机相连,用于接收外部数据或者控制指令。13.根据权利要求12所述的系统,其特征在于,所述运算芯片将外部数据存储到所述2个以上运算芯片的至少一个存储单元。14.根据权利要求12所述的系统,其特征在于,所述第一数据接口为UART控制单元。15.根据权利要求8所述的系统,其特征在于,所述N个内核core和所述至少一个存储控制单元中的每一个相连;根据所述N个内核...
【专利技术属性】
技术研发人员:秦强,
申请(专利权)人:北京比特大陆科技有限公司,
类型:新型
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。