一种面向人工智能应用场景的多核系统架构及其实现方法技术方案

技术编号:40475979 阅读:53 留言:0更新日期:2024-02-26 19:12
本发明专利技术涉及一种面向人工智能应用场景的多核系统架构及其实现方法,包括多核处理器,人工智能计算相关的专用硬件加速器,AI场景涉及到的数字信号处理专用硬件加速器,用于捕捉AI场景中待处理信息的采集设备,每个内核私有的直接内存访问模块,用于对多核间以及各自私有外设间数据仲裁并与核外共享设备间进行数据通信的多核仲裁接口,用于存储待处理的IO设备采集到的信号处理数据的存储器。本发明专利技术通过将AI场景中涉及到的CNN,DSP以及数据采集等大量数据传输以及复杂计算通过专用硬件加速器处理,并将各专用硬件加速器分配为不同内核的私有外设,并配备各自专用的DMA进行数据传输,保证每种大量数据传输以及复杂计算之间不会相互影响,并行执行,提高AI应用场景处理的效率。

【技术实现步骤摘要】

本专利技术属于硬件系统架构领域,尤其涉及一种面向人工智能应用场景的多核系统架构。


技术介绍

1、随着ai的高速发展以及推广,其已经应用到人们日常生活中的各个领域,ai算法的优化以及结构的迭代也对硬件算力提出了更高的要求,而在ai实际的应用场景中,常伴随着信号采集,信号处理等大规模的数据搬运以及复杂计算,因而在ai场景中,对硬件处理能力提出了更高的要求。

2、虽然目前已经存在单核处理器挂载ai以及信号相关专用硬件加速器实现场景的应用,但由于硬件加速器需要与处理器高度配合,而硬件加速器之间的协同以及处理器并行处理的带宽极大的影响了各种类型数据处理的效率。因此,以单核处理器为核心的系统架构存在效能瓶颈,如何在保证各种大规模数据处理正常实现且不影响高速并行执行成为了提高ai应用场景处理能效的重中之重。


技术实现思路

1、本专利技术提供一种面向人工智能应用场景的多核系统架构,该架构将人工智能应用场景中涉及到的大规模数据搬运和复杂计算的专用加速器分配至多核系统的每一个处理器中与处理器进行协同工作。

...

【技术保护点】

1.一种面向人工智能应用场景的多核系统架构,其特征在于,包括AI处理单元、信号处理单元、存储器;其中,

2.根据权利要求1所述的一种面向人工智能应用场景的多核系统架构,其特征在于,所述FFT和FIR硬件加速器包含DSP加速器,用于加速输入信号处理中涉及数字滤波、傅里叶变换的计算。

3.根据权利要求1所述的一种面向人工智能应用场景的多核系统架构,其特征在于,还包括FLASH0以及FLASH1,分别作为CPU0、CPU1私有访问的启动存储器。

4.根据权利要求1所述的一种面向人工智能应用场景的多核系统架构,其特征在于,所述CPU0中移植Linux操作系统,...

【技术特征摘要】

1.一种面向人工智能应用场景的多核系统架构,其特征在于,包括ai处理单元、信号处理单元、存储器;其中,

2.根据权利要求1所述的一种面向人工智能应用场景的多核系统架构,其特征在于,所述fft和fir硬件加速器包含dsp加速器,用于加速输入信号处理中涉及数字滤波、傅里叶变换的计算。

3.根据权利要求1所述的一种面向人工智能应用场景的多核系统架构,其特征在于,还包括flash0以及flash1,分别作为cpu0、cpu1私有访问的启动存储器。

4.根据权利要求1所述的一种面向人工智能应用场景的多核系统架构,其特征在于,所述cpu0中移植linux操作系统,并运行将cnn加速器针对不同ai算法结构解析的编译器以及硬件...

【专利技术属性】
技术研发人员:朱智彧王涣于旺
申请(专利权)人:中国电子科技集团公司第四十七研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1