累加方法、系统和存储介质技术方案

技术编号:40020190 阅读:25 留言:0更新日期:2024-01-16 16:38
本公开提供一种累加方法、系统和存储介质。该方法包括:分配一对缓冲器,第一指针和第二指针分别指向一对缓冲器;对于第一稀疏矩阵中包括多个非零元素的每个第一行,识别第二稀疏矩阵中对应于多个非零元素的多个第二行;获取基于每个非零元素和对应于其的第二行计算的多个中间列表;将多个中间列表存储到第一缓冲器;执行迭代过程,包括:将第一缓冲器中多个中间列表合并为较少数量的中间列表;将较少数量的中间列表存储到第二缓冲器;交换第一指针和第二指针;确定是否满足退出迭代过程的退出条件;将一个最终合并列表作为稀疏矩阵‑矩阵乘法的输出矩阵的一行,从第一缓冲器迁移到系统存储器。本公开减小了存储器复杂度和内存开销。

【技术实现步骤摘要】

本公开通常涉及高效利用存储器的用于稀疏矩阵-矩阵乘法的累加方法、系统和存储介质


技术介绍

1、在许多实际应用中,广义稀疏矩阵-矩阵乘法(general sparse matrix-matrixmultiplication,spgemm)是一种原始且昂贵的计算方式,其涉及对稀疏矩阵执行spgemm。例如,公开可用的套件稀疏矩阵集合(suitesparse matrix collection)是一个庞大且积极增长的稀疏矩阵集合,该稀疏矩阵来自广泛的领域,例如,半导体器件、计算机图形和视觉、机器人技术和运动学、量子化学、化学过程模拟等。

2、虽然spgemm被认为是一种内存有限算法(memory-bounded algorithm),但现有的大多数工作专注于优化计算吞吐量,而不是存储效率。事实上,spgemm的更高效的存储设计可以允许在高速缓存中执行大多数数据访问和计算,这将进一步提高计算吞吐量。因此,迫切需要一种综合考虑计算吞吐量和存储开销的性能模型。


技术实现思路

1、本说明书的各种实施例可包括用本文档来自技高网...

【技术保护点】

1.一种用于稀疏矩阵-矩阵乘法的累加方法,包括:

2.根据权利要求1所述的累加方法,其中,还包括:

3.根据权利要求2所述的累加方法,其中,还包括:

4.根据权利要求1所述的累加方法,其中,所述将所述第一缓冲器中的所述多个中间列表合并为较少数量的中间列表,将所述较少数量的中间列表存储到所述第二缓冲器中包括:

5.根据权利要求1所述的累加方法,其中,以紧凑型数据格式存储所述第一稀疏矩阵和所述第二稀疏矩阵,其中所述紧凑型数据格式排除所述第一稀疏矩阵和所述第二稀疏矩阵中的零值数据。

6.根据权利要求1所述的累加方法,其中,还包括:...

【技术特征摘要】

1.一种用于稀疏矩阵-矩阵乘法的累加方法,包括:

2.根据权利要求1所述的累加方法,其中,还包括:

3.根据权利要求2所述的累加方法,其中,还包括:

4.根据权利要求1所述的累加方法,其中,所述将所述第一缓冲器中的所述多个中间列表合并为较少数量的中间列表,将所述较少数量的中间列表存储到所述第二缓冲器中包括:

5.根据权利要求1所述的累加方法,其中,以紧凑型数据格式存储所述第一稀疏矩阵和所述第二稀疏矩阵,其中所述紧凑型数据格式排除所述第一稀疏矩阵和所述第二稀疏矩阵中的零值数据。

6.根据权利要求1所述的累加方法,其中,还包括:

7.根据权利要求6所述的累加方法,其中,所述符号计算包括:

8.根据权利要求1所述的累加方法,其中,所述处理器包括多核处理器,所述累加方法还包括:

9.根据权利要求8所述的累加方法,其中,所述多核处理器包括多核cpu。

10.根据权利要求8所述的累加方法,其中,所述多核处理器包括gpu,所述多个核包括所述gpu的多个流式多处理器。

11.根据...

【专利技术属性】
技术研发人员:杜朝阳关义金牛迪民郑宏忠
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1