一种基于存内计算技术的新型粗粒度可配置架构制造技术

技术编号:45082812 阅读:19 留言:0更新日期:2025-04-25 18:21
本发明专利技术公开一种基于存内计算技术的新型粗粒度可配置架构,涉及SRAM技术,针对现有技术中依赖片上缓存等四大问题提出本方案。包括分散/聚集模块、管理模块、转换模块以及存内计算宏。存内计算宏用于在管理模块控制下进行运算。其优点在于,相较其他基于冯·诺依曼架构处理引擎的粗粒度可配置架构技术方案,具有面积更小,功耗更低,吞吐量更高的特点。同时针对SRAM存内计算技术的四大挑战提出一个可行的解决方案:利用率方面充分利用存内计算技术在算力密度和能效方法的优势;计算架构方法灵活决定粗粒度可配置架构的片上缓存大小;计算完备性方面满足更多的应用的计算要求;软件生态方面允许被RISC‑V CPU调用,支持编译和加速RISC‑V生态下的应用。

【技术实现步骤摘要】

本专利技术涉及sram技术,尤其涉及一种基于存内计算技术的新型粗粒度可配置架构


技术介绍

1、尽管sram存内计算技术由于具备工艺成熟度高和强鲁棒性的优势已经成为当前主流存算一体解决方案之一,然而其仍旧面临着包括单元电路设计、可靠性、利用率、计算架构、计算完备性、软件生态等关键问题和挑战。在利用率方面,由于算子种类和大小各不相同,面对真实应用中灵活多变的算子需求,在一个固定大小和固定算子的存内计算阵列上部署不同的真实应用可能会造成计算资源利用率显著降低,导致无法充分发挥sram存内计算技术在算力密度、能效等方面带来的性能优势。在计算架构方面,由于在执行算法过程中,部分数据例如中间计算结果仍然需要依赖片上缓存,使得有限的片上缓存容量可能会成为新的系统瓶颈,导致片外访存开销显著增加。关于计算完备性,尽管存内计算针对矩阵-矩阵运算能显著提高算力密度和能效,但真实应用场景中一个完整的应用依然需要标量运算,向量运算和非线性计算,这对基于sram的存内计算加速器的计算完备性提出了新的需求。关于软件生态,除了底层电路的优化和性能提升以外,为了实现存内计算技术落地同样需本文档来自技高网...

【技术保护点】

1.一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,包括:

2.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述分散/聚集模块包括两个缓存、一个向左移位器、一个向右移位器;外部数据分为报头和输入数据;

3.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述管理模块包括两个数据交互模块,两个CIM管理器,一个便签存储器SPM,一个CIM映射寄存器,一个交叉开关矩阵;从分散/聚集模块传递来的指令和数据信号分别送入CIM映射寄存器和数据交互模块中;

4.根据权利要求1所述一种基于存内计算技术的...

【技术特征摘要】

1.一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,包括:

2.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述分散/聚集模块包括两个缓存、一个向左移位器、一个向右移位器;外部数据分为报头和输入数据;

3.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述管理模块包括两个数据交互模块,两个cim管理器,一个便签存储器spm...

【专利技术属性】
技术研发人员:邹毅杨延峰宋县锋薛志彪郝英博
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1