一种新型外积累加求解稠密矩阵与稀疏矩阵内积的方法技术

技术编号：28472914 阅读：21 留言：0更新日期：2021-05-15 21:40

本发明专利技术属于计算机应用设备领域，尤其涉及一种新型外积累加求解稠密矩阵与稀疏矩阵内积的方法。包括以下有效步骤：a、首先对稠密矩阵A(MxK)与稀疏矩阵B(KxN)原始数据的完成读取；b、对稀疏矩阵B(KxN)进行行向数据压缩，将二维布局的稀疏矩阵B(KxN)行向压缩为一维布局的行向压缩稀疏矩阵B(KxN)；c、读取行向压缩稀疏矩阵B(KxN)第i列以及读取稠密矩阵A(MxK)第i行外积运算生成ci；d、对所得到的外积结果进行累加，即可得到稠密矩阵A(MxK)与稀疏矩阵B(KxN)的内积；其中，所述b步骤中，针对稀疏矩阵B(KxN)的压缩特点在于，对于每一行的起点第一个元素值都保留，不论该元素值是否为零，每一行的非起点元素则根据是否是零值，来判断是否保留，若是零值则丢弃，若是非零值则保留。若是非零值则保留。若是非零值则保留。

全部详细技术资料下载

【技术实现步骤摘要】
一种新型外积累加求解稠密矩阵与稀疏矩阵内积的方法

[0001]本专利技术属于计算机应用设备领域，尤其涉及一种新型外积累加求解稠密矩阵与稀疏矩阵内积的方法。

技术介绍

[0002]矩阵内积乘法是数值计算、机器学习、工程模拟等众多领域算法的基础，而稠密矩阵A(MxK)与稀疏矩阵B(KxN)内积乘法是一类常见的矩阵内积计算场景。
[0003]稠密矩阵A(MxK)与稀疏矩阵B(KxN)，其特点在于稀疏矩阵B(KxN)其中存在一定量的零元素。这部分零元素是可以不参与计算依然保证运算结果的正确性，同时如果零元素直接放弃存储还能来内存利用效率的提升。
[0004]但是在计算和存储的过程中对稀疏矩阵B(KxN)之中零元素的跳过会导致内存访问的不连续，不利于利用现代处理器架构中的各级高速缓存。因而涉及稀疏矩阵内积的计算效率低于稠密矩阵与稠密矩阵的内积。
[0005]此处以稠密矩阵A(4x4)与稀疏矩阵B(4x3)内积举例，稀疏矩阵B(4x3)是一般稀疏矩阵，其特点是零元素的分布没有规律。图1是稠密矩阵A(4x4)与稀疏矩阵B(4x3)内积计算按照外积之和累加方式求解的第一步。本步中首先取出稠密矩阵A(4x4)的第一列a1(4x1)与稀疏矩阵B(4x3)第一行b1(1x3)执行外积运算得到结果c1，以此类推稠密矩阵A的第2列a2与稀疏矩阵B的第2行b2也执行外积运算得到结果c2。稠密矩阵A(4x4)有四列，稀疏矩阵B(4x3)有四行，列与行一一对应外积得到c1(4x3)、c2(4x3)、c3(4x3)、c4(4x

【技术保护点】

【技术特征摘要】
1.一种新型外积累加求解稠密矩阵与稀疏矩阵内积的方法，其特征在于，包括以下有效步骤：a、首先对稠密矩阵A(MxK)与稀疏矩阵B(KxN)原始数据的完成读取；b、对稀疏矩阵B(KxN)进行行向数据压缩，将二维布局的稀疏矩阵B(KxN)行向压缩为一维布局的行向压缩稀疏矩阵B(KxN)；c、读取行向压缩稀疏矩阵B(KxN)第i列以及读取稠密矩阵A(MxK)第i行外积运算生成ci；d、对所得到的外积结果进行累加，即可得到稠密矩阵A(MxK)与稀疏矩阵B(KxN)的内积；其中，所述b步骤中，针对稀疏矩阵B(KxN)的压缩特点在于，对于每一行的起点第一个元素值都保留，不论该元素值是否为零，每一行的非起点元素则根据是否是零值，来判断是否保留，...

【专利技术属性】
技术研发人员：周晓辉，袁博，华诚，
申请(专利权)人：算筹信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人