System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及处理器,特别是涉及一种稀疏矩阵乘指令实现方法及系统。
技术介绍
1、如何在不太影响性能的前提下减少神经网络的计算量,是目前神经网络优化的重点方向。
2、现有技术中,通过剪除训练好的模型中一些不重要的参数,从而压缩神经网络的规模。由于剪除的是权重较小的参数,因此对模型输出结果的影响很小。这种方法被称为剪枝,经过不断的研究和发展,剪枝已经成为了最重要的神经网络优化技术之一,经过剪枝,可以使得轻量级的网络在边缘设备上也能有较快的推理速度,并且推理结果精度与压缩前的网络接近。
3、目前,常规的稀疏矩阵,例如神经网络细粒度自动剪枝得到的矩阵,往往不够规整,导致出现实际压缩比不高、访存不均匀、负载不均衡等情况,在常规计算装置上无法达到理论性能,对矩阵乘的加速没有明显的帮助。
4、因此,提供一种对存储空间、访存带宽有显著优化效果,可以减少存储体访问冲突,实现负载均衡,且针对不同稀疏度优化后的稀疏矩阵乘效率有明显提升的稀疏矩阵乘指令实现方法及系统是本领域技术人员亟待解决的问题。
技术实现思路
1、本专利技术的目的在于提供一种稀疏矩阵乘指令实现方法及系统,该方法逻辑清晰,安全、有效、可靠且操作简便,对存储空间、访存带宽有显著优化效果,可以减少存储体访问冲突,实现负载均衡,且针对不同稀疏度优化后的稀疏矩阵乘效率有明显提升。
2、基于以上目的,本专利技术提供的技术方案如下:
3、一种稀疏矩阵乘指令实现方法,包括如下步骤:
< ...【技术保护点】
1.一种稀疏矩阵乘指令实现方法,其特征在于,包括如下步骤:
2.如权利要求1所述的稀疏矩阵乘指令实现方法,其特征在于,所述根据稀疏矩阵乘指令中的矩阵规模、稀疏度和数据类型,获取压缩后的稀疏矩阵,包括如下步骤:
3.如权利要求2所述的稀疏矩阵乘指令实现方法,其特征在于,获取稀疏索引矩阵,包括如下步骤:
4.如权利要求1所述的稀疏矩阵乘指令实现方法,其特征在于,获取稠密矩阵,具体为:
5.如权利要求1所述的稀疏矩阵乘指令实现方法,其特征在于,所述根据所述压缩后的稀疏矩阵、所述稀疏索引矩阵数据和所述获取稠密矩阵执行矩阵乘操作,以获取目标矩阵,包括如下步骤:
6.如权利要求1所述的稀疏矩阵乘指令实现方法,其特征在于,所述写入所述目标矩阵对应的寄存器中,具体为:
7.一种稀疏矩阵乘指令实现系统,其特征在于,包括:稀疏矩阵模块、索引矩阵数据模块、稠密矩阵模块和目标矩阵模块;
【技术特征摘要】
1.一种稀疏矩阵乘指令实现方法,其特征在于,包括如下步骤:
2.如权利要求1所述的稀疏矩阵乘指令实现方法,其特征在于,所述根据稀疏矩阵乘指令中的矩阵规模、稀疏度和数据类型,获取压缩后的稀疏矩阵,包括如下步骤:
3.如权利要求2所述的稀疏矩阵乘指令实现方法,其特征在于,获取稀疏索引矩阵,包括如下步骤:
4.如权利要求1所述的稀疏矩阵乘指令实现方法,其特征在于,获取稠密矩阵,具体为:
【专利技术属性】
技术研发人员:刘胜,郭阳,崔剑峰,雷元武,陈小文,李晨,张洋,刘畅,汤先拓,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。