【技术实现步骤摘要】
本专利技术涉及sram技术,尤其涉及一种基于存内计算技术的新型粗粒度可配置架构。
技术介绍
1、尽管sram存内计算技术由于具备工艺成熟度高和强鲁棒性的优势已经成为当前主流存算一体解决方案之一,然而其仍旧面临着包括单元电路设计、可靠性、利用率、计算架构、计算完备性、软件生态等关键问题和挑战。在利用率方面,由于算子种类和大小各不相同,面对真实应用中灵活多变的算子需求,在一个固定大小和固定算子的存内计算阵列上部署不同的真实应用可能会造成计算资源利用率显著降低,导致无法充分发挥sram存内计算技术在算力密度、能效等方面带来的性能优势。在计算架构方面,由于在执行算法过程中,部分数据例如中间计算结果仍然需要依赖片上缓存,使得有限的片上缓存容量可能会成为新的系统瓶颈,导致片外访存开销显著增加。关于计算完备性,尽管存内计算针对矩阵-矩阵运算能显著提高算力密度和能效,但真实应用场景中一个完整的应用依然需要标量运算,向量运算和非线性计算,这对基于sram的存内计算加速器的计算完备性提出了新的需求。关于软件生态,除了底层电路的优化和性能提升以外,为了实现存
...【技术保护点】
1.一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,包括:
2.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述分散/聚集模块包括两个缓存、一个向左移位器、一个向右移位器;外部数据分为报头和输入数据;
3.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述管理模块包括两个数据交互模块,两个CIM管理器,一个便签存储器SPM,一个CIM映射寄存器,一个交叉开关矩阵;从分散/聚集模块传递来的指令和数据信号分别送入CIM映射寄存器和数据交互模块中;
4.根据权利要求1所述一
...【技术特征摘要】
1.一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,包括:
2.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述分散/聚集模块包括两个缓存、一个向左移位器、一个向右移位器;外部数据分为报头和输入数据;
3.根据权利要求1所述一种基于存内计算技术的新型粗粒度可配置架构,其特征在于,所述管理模块包括两个数据交互模块,两个cim管理器,一个便签存储器spm...
【专利技术属性】
技术研发人员:邹毅,杨延峰,宋县锋,薛志彪,郝英博,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。