【技术实现步骤摘要】
矩阵乘法电路、方法及相关产品
[0001]本披露一般地涉及数据处理领域。更具体地,本披露涉及矩阵乘法电路、利用矩阵乘法电路执行稀疏矩阵乘法的方法、芯片和板卡。
技术介绍
[0002]稀疏矩阵在数据处理中占有一定的比例。例如,近年来迅猛发展的深度学习算法是一种计算密集型和存储密集型的工具,随着信息处理任务的日趋复杂,对算法实时性和准确性要求不断增高,神经网络往往会被设计得越来越深,使得其计算量和存储空间需求越来越大,导致现存的基于深度学习的人工智能技术难以直接应用在硬件资源受限的手机、卫星或嵌入式设备上。
[0003]因此,深度神经网络模型的压缩、加速、优化变得格外重要。稀疏化正是模型轻量化方法之一。网络参数稀疏化是通过适当的方法减少较大网络中的冗余成分,以降低网络对计算量和存储空间的需求。这种网络参数稀疏化将会产生稀疏矩阵。
[0004]稀疏矩阵矩阵的性质决定了它能够利用数据结构特点极大地降低运算和存储复杂度。因此,稀疏矩阵相关存储和运算方式的研究和硬件化实现,能够为处理相关数据结构的处理性能带来巨大的提升。 ...
【技术保护点】
【技术特征摘要】
1.一种矩阵乘法电路,其中左乘矩阵和右乘矩阵中至少一个是稀疏矩阵,所述电路包括:分段电路,配置用于将左乘矩阵第i行向量和右乘矩阵的第j列向量对应地分割成若干个相互配对的向量段,i、j为自然数;控制电路,配置用于根据向量段中的零值情况,丢弃相应的向量段;向量内积电路,配置用于对保留的向量段中配对的向量段执行向量内积运算以得到对应的内积值;以及累加电路,配置用于将所述内积值进行累加,以生成结果矩阵中第i行第j列的元素。2.根据权利要求1所述的电路,其中所述控制电路进一步配置用于:当任一向量段为全零时,丢弃所述向量段以及与其配对的向量段。3.根据权利要求1或2所述的电路,其中所述控制电路进一步配置用于:当任一向量段中的非零数据元素的索引与其配对的向量段中的非零数据元素的索引均不匹配时,丢弃所述向量段及其配对的向量段,其中所述索引指示所述非零数据元素在向量段内的位置。4.根据权利要求1所述的电路,其中所述控制电路进一步配置用于:当所述左乘矩阵和右乘矩阵中一方的任一向量段为全零时,丢弃所述向量段,保留另一方中与所述向量段配对的向量段;以及进行标识,以便从保留的向量段中提取配对的向量段执行向量内积运算。5.根据权利要求1或4所述的电路,其中所述控制电路进一步配置用于:当所述左乘矩阵和右乘矩阵中一方的任一向量段中的非零数据元素的索引与其配对的向量段中的非零数据元素的索引均不匹配时,丢弃所述向量段,保留另一方中与所述向量段配对的向量段,其中所述索引指示所述非零数据元素在向量段内的位置;以及进行标识,以便从保留的向量段中提取配对的向量段...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:安徽寒武纪信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。