【技术实现步骤摘要】
半数字交叉式架构的稀疏神经网络层的优化相关申请的交叉引用本申请要求优先于2019年10月31日在美国专利商标局提交的并被分配序列号62/929,000的美国临时专利申请的优先权,其全部内容通过引用合并于此。
本公开总体上涉及一种排列(permute)稀疏矩阵以使得子块被稀疏(或致密)的方法和装置。
技术介绍
对用于机器学习(machinelearning,ML)应用的硬件加速器的需求不断增长。在许多这些ML应用中占主导地位的计算是矩阵向量乘法。修剪方法已被证明能够稀疏层,从而产生很大部分的零值元素。已经开发出用于全数字架构的稀疏向量矩阵乘法技术,提高了推理操作的能力/性能。对于非稀疏矩阵,可以通过交叉式网络(crossbarnetwork)在模拟中非常有效地执行矩阵向量乘法。然而,对于已被修剪的网络,在这些模拟或半模拟交叉式网络中通常不会像在全数字设计中那样实现节能,因为与阵列加电相关的开销招致的开销并未显著减少,即使很大一部分权重为零。为了节能,可以将零值元素局部相关。
技术实现思路
在 ...
【技术保护点】
1.一种方法,包括:/n将二元矩阵映射到无向图形式;/n对映射的二元矩阵应用二路图分区算法,所述二路图分区算法使映射的二元矩阵中的分区之间的边切割最小化;/n递归应用贪婪算法以找到行或列排列的集合,所述行或列排列的集合使非零从稀疏块到非稀疏块的转移最大化;以及/n根据所应用的贪婪算法稀疏或致密二元矩阵。/n
【技术特征摘要】
20191031 US 62/929,000;20200415 US 16/849,6381.一种方法,包括:
将二元矩阵映射到无向图形式;
对映射的二元矩阵应用二路图分区算法,所述二路图分区算法使映射的二元矩阵中的分区之间的边切割最小化;
递归应用贪婪算法以找到行或列排列的集合,所述行或列排列的集合使非零从稀疏块到非稀疏块的转移最大化;以及
根据所应用的贪婪算法稀疏或致密二元矩阵。
2.根据权利要求1所述的方法,其中,所述二路图分区算法包括最小切割算法。
3.根据权利要求2所述的方法,其中,所述最小切割算法是超图最小切割算法。
4.根据权利要求1所述的方法,其中,应用所述贪婪算法还包括选择具有最少数量的非零元素的N个子块作为目标子集。
5.根据权利要求4所述的方法,还包括根据所述目标子集中的非零元素的数量的变化,对成对的行排列进行排序。
6.根据权利要求5所述的方法,其中,基于从最小负变化到最大负变化的变化,对所述成对的行排列进行排序。
7.如权利要求5所述的方法,还包括根据所述目标子集中的非零元素的数量的变化,对成对的列排列进行排序。
8.根据权利要求7所述的方法,其中,基于从最小负变化到最大负变化的变化,对所述成对的列排列进行排序。
9.如权利要求7所述的方法,还包括将来自行列表和列列表两者的非零的总变化相加,并构造排列向量。
10.如权利要求9所述的方法,还包括重复所述行排列的排序、所述列排列的排序、所述总变化的相加以及所述排列向量的构造步骤,直到所述行列表和所述列列表为空。...
【专利技术属性】
技术研发人员:R哈彻,T拉克什特,D帕莱,洪俊顾,J基特尔,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:韩国;KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。