当前位置: 首页 > 专利查询>北京大学专利>正文

基于忆阻器的大模型存算一体加速方法及其适配的数据流处理方法技术

技术编号:42679309 阅读:42 留言:0更新日期:2024-09-10 12:30
本发明专利技术公开了一种基于忆阻器的大模型存算一体加速方法及其适配的数据流处理方法,该方法将大模型内的庞大参数量,以分布式的方式卸载到忆阻器存算一体架构上,该架构将存储分为多个层次,存算一体模块、计算核心、单片和忆阻器阵列级别,以使用相同的架构承载不同的网络结构。在这一架构的基础上,本发明专利技术对以GPT‑3为例的大模型进行算子拆解,并设计数据流最大化并行利用硬件资源,达到大模型加速的效果。本发明专利技术公开了上述架构和数据流设计,填补了当前大模型硬件加速在基于忆阻器的存算一体系统上的架构空白和数据流空白,促进存算一体技术和大模型技术的进一步发展。

【技术实现步骤摘要】

本专利技术属于存算一体,具体涉及一种基于忆阻器的大模型存算一体加速方案。


技术介绍

1、现阶段,主流的计算芯片通常采用冯诺依曼这一传统计算架构。然而,随着摩尔定律趋于饱和,传统冯氏架构中存储器与计算单元分离带来的瓶颈效应愈发凸显,连接存储器与计算单元单元的数据总线带宽和数据搬运功耗限制了计算芯片延迟与能效等指标的进一步提升。并且随着大模型的出现,对硬件计算系统的计算性能和存储性能均提出了更高的要求。

2、在这一背景下,研究人员提出了一系列新型计算范式,融合存储与计算功能的存算一体技术成为打破传统冯诺依曼架构瓶颈的核心技术路径。通过在存储器内部或周边添加合适的外围电路,能够为存储器单元赋予计算能力,从而减少了数据搬运的需求,减轻了数据总线带宽和功耗的瓶颈效应。而近年来快速发展的新型非易失性存储器为实现存算一体技术提供了更有力的支撑,其中以忆阻器表现尤为突出。

3、然而,在现有存算一体系统设计中,缺少对以gpt-3为例的大模型网络的加速方案。这些模型对硬件资源的需求却极为巨大,拥有数十亿甚至上百亿的参数。这些参数包括网络的权重和偏置,需本文档来自技高网...

【技术保护点】

1.一种基于忆阻器的大模型存算一体加速方法,其特征在于,

2.如权利要求1所述的基于忆阻器的大模型存算一体加速方法,其特征在于,步骤2)中由32块1GB忆阻器阵列组、一块MB量级静态随机存储器、一组近存计算电路和一块交互模块共同组成单裸片,其中,静态随机存储器用于存放预加载参数,忆阻器阵列组用于存储网络权重或计算向量,而近存计算电路则包括8比特整型和半精度浮点数转换、乘法单元还有加法单元模块,4块裸片带上交互模块组成一个计算核心,32个计算核心、一个存算模块控制中心和一块交互模块组成一块存算一体模块。

3.如权利要求2所述的基于忆阻器的大模型存算一体加速方法,其特...

【技术特征摘要】

1.一种基于忆阻器的大模型存算一体加速方法,其特征在于,

2.如权利要求1所述的基于忆阻器的大模型存算一体加速方法,其特征在于,步骤2)中由32块1gb忆阻器阵列组、一块mb量级静态随机存储器、一组近存计算电路和一块交互模块共同组成单裸片,其中,静态随机存储器用于存放预加载参数,忆阻器阵列组用于存储网络权重或计算向量,而近存计算电路则包括8比特整型和半精度浮点数转换、乘法单元还有加法单元模块,4块裸片带上交互模块组成一个计算核心,32个计算核心、一个存算模块控制中心和一块交互模块组成一块存算一体模块。

3.如权利要求2所述的基于忆阻器的...

【专利技术属性】
技术研发人员:杨玉超朱奕航陶耀宇荆兆坤
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1