数据处理装置、数据处理方法及相关产品制造方法及图纸

技术编号:33990472 阅读:31 留言:0更新日期:2022-07-02 09:33
本披露公开了一种数据处理装置、数据处理方法及相关产品。该数据处理装置可以实现为计算装置包括在组合处理装置中,该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与计算装置和其他处理装置连接,用于存储该计算装置和其他处理装置的数据。本披露的方案提供了数据融合相关操作的专用指令,其可以简化处理,提高机器的处理效率。提高机器的处理效率。提高机器的处理效率。

【技术实现步骤摘要】
数据处理装置、数据处理方法及相关产品


[0001]本披露一般地涉及处理器领域。更具体地,本披露涉及数据处理装置、数据处理方法、芯片和板卡。

技术介绍

[0002]近年来,随着深度学习的迅猛发展,使得计算机视觉、自然语言处理等一系列领域的算法性能都有了跨越式的进展。然而深度学习算法是一种计算密集型和存储密集型的工具,随着信息处理任务的日趋复杂,对算法实时性和准确性要求不断增高,神经网络往往会被设计得越来越深,使得其计算量和存储空间需求越来越大,导致现存的基于深度学习的人工智能技术难以直接应用在硬件资源受限的手机、卫星或嵌入式设备上。
[0003]因此,深度神经网络模型的压缩、加速、优化变得格外重要。大量的研究试着在不影响模型精度的前提下,减少神经网络的计算和存储需求,对深度学习技术在嵌入端、移动端的工程化应用具有十分重要的意义。稀疏化正是模型轻量化方法之一。
[0004]网络参数稀疏化是通过适当的方法减少较大网络中的冗余成分,以降低网络对计算量和存储空间的需求。现有的硬件和/或指令集不能有效地支持稀疏化处理和/或稀疏化后相关的处理本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理装置,包括:控制电路,其配置用于解析融合指令,所述融合指令指示对多路待融合的数据进行归并排序累加处理;存储电路,其配置用于存储处理前和/或处理后的信息;以及运算电路,其配置用于根据所述融合指令,将所述多路待融合的数据中数据元素按照其对应的索引,归并为一路有序的融合数据,所述融合数据中具有相同索引的数据元素合并为一个融合数据元素,以及有序输出所述融合数据。2.根据权利要求1所述的数据处理装置,其中所述融合指令的操作对象包括输入的待融合的K路数据、所述K路数据对应的K路索引、所述K路数据的尺寸、以及输出的一路融合数据和一路融合索引,K>1,其中:所述K路索引中的索引元素指示所述K路数据中对应的数据元素的索引信息;所述K路索引中每路索引的索引元素均按第一顺序有序排列;所述K路数据中每路数据的数据元素按照对应索引的顺序有序排列;输出的所述一路融合索引中的融合索引元素按第二顺序有序排列;并且所述一路融合数据中的融合数据元素按照融合索引的顺序有序排列。3.根据权利要求2所述的数据处理装置,其中所述第一顺序与第二顺序相同或不同,并且所述第一顺序和第二顺序选自以下任一:从小到大的顺序,或从大到小的顺序。4.根据权利要求2

3任一所述的数据处理装置,其中所述运算电路包括排序电路和累加电路,其中所述排序电路配置用于将所述K路索引按照索引元素的大小排序并有序输出给所述累加电路;并且所述累加电路配置用于当从所述排序电路接收到相同的索引元素时,将相同的索引元素对应的数据元素进行累加处理,并去除重复的索引元素。5.根据权利要求4所述的数据处理装置,其中所述排序电路包括比较电路和缓冲电路,其中:所述比较电路配置用于将所述K路索引中待排序的索引元素与所述缓冲电路中未输出的索引元素进行比较,并输出比较结果给所述控制电路;并且所述缓冲电路配置用于根据所述控制电路的控制,有序存储已比较的索引元素以及与其对应的数据元素的信息,以及有序输出已比较的索引元素以及与其对应的数据元素的信息。6.根据权利要求5所述的数据处理装置,其中所述比较电路包括:K

1路比较器,配置用于将所述K路索引中待排序的索引元素分别与所述缓冲电路中当前序列的K

1个索引元素进行比较,生成比较结果并输出给所述控制电路。7.根据权利要求6所述的数据处理装置,其中所述控制电路配置用于根据所述比较结果,确定所述待排序的索引元素在所述缓冲电路中当前序列中的插入位置。8.根据权利要求7所述的数据处理装置,其中所述比较结果使用位图来表示,并且所述控制电路进一步配置用于:根据所述位图中比特位的变化位置,确定所述插入位置。9.根据权利要求7

8任一所述的数据处理装置,其中所述缓冲电路配置用于根据所述控制电路的指示,在所述插入位置中插入所述待排序的索引元素以及与其对应的数据元素
的信息。10.根据权利要求5

9任一所述的数据处理装置,其中所述缓冲电路进一步配置用于按指定顺序输出当前序列中的首个或末个索引元素以及与其对应的数据元素的信息。11.根据权利要求10所述的数据处理装置,其中所述控制电路进一步配置用于:根据所述缓冲电路中输出的索引元素,确定待排序的下一索引元素的访存信息。12.根据权利要求4

11任一所述的数据处理装置,其中所述累加电路包括比较器、缓冲器和加法器,其中:所述比较器配置用于将从所述排序电路输出的索引元素与上一个融合索引元素进行比较并输出比较结果;所述缓冲器配置用于仅当所述比较结果指示不相同时,输出所述索引元素作为新的融合索引元素;并且所述加法器配置用于当所述比较结果指示不相同时,直接输出与所述索引元素对应的数据元素作为新的融合数据元素,以及当所述比较结果指示相同时,将所述索引元素对应的数据元素累加到上一个融合索引元素所对应的融合数据元素上。13.根据权利要求1

12任一所述的数据处理装置,其中所述多路待融合的数据中的数据元素是稀疏矩阵中的有效数据元素,并且所述索引指示所述有效数据元素在稀疏矩阵中的位置信息。14.根据权利要求2

13任一所述的数据处理装置,其中所述融合指令的操作对象还包括输出的融合数据元素总个数,用于指示所述输出的一路融合数据中的数据元素总个数。15.根据权利要求2

14任一所述的数据处理装置,其中所述输入的K路数据通过第一地址来指示,第一地址包括K个元素,第i个元素表示第i路数据的地址,其中0<i≤K。16.根据权利要求2

15任一所述的数据处理装置,其中所述K路索引通过第二地址来指示,第二地址包括K个元素,第i个元素表示与第i路数据关联的第i路索引的地址,其中0<i≤K。17.根据权利要求2

16任一所述的数据处理装置,其中所述K路数据的尺寸通过第三地址来指示,第三地址包括K个元素,第i个元素表示第i路数据中数据元素的个数,其中0<i≤K。18.根据权利要求2

17任一所述的数据处理装置,其中所述输出的一路融合数据通过第四地址来指示,第四地址包括L个元素,第j个元素表示所述一路融合数据中的第j个数据元素,L表示所述融合数据中的数据元素总个数,L≥1,0<j≤L。19.根据权利要求2

18任一所述的数据处理装置,其中所述一路融合索引通过第五地址来指示,第五地址包括L个元素,第j个元素表示所述一路融合索引中的第j个索引元素,L表示所述融合索引中的索引元素总个数,L≥1,0<j≤L。20.根据权利要求2

14任一所述的数据处理装置,其中,至少一个所述操作对象包括张量数据,并且所述张量数据通过至少一个描述符来指示,所述描述符指示以下至少一项信息:张量数据的形状信息和张量数据的空间信息;并且
所述数据处理装置还包括张量接口电路,其配置用于对所述描述符进行解析,以供获取所述张量数据。21.根据权利要求20所述的数据处理装置,其中所述张量接口电路进一步配置用于:根据所述形状信息,确定所述张量数据在数据存储空间中的数据地址;和/或根据所述空间信息,确定指令之间的依赖关系。22.根据权利要求20

21任一所述的数据处理装置,其中所述张量数据的形状信息包括表示N维张量数据的形状的至少一个形状参数,N为正整数,所述张量数据的形状参数包括以下至少一种:所述张量数据所在的数据存储空间在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于数据基准点的位置、所述张量数据的数据描述位置与数据地址之间的映射关系。23.根据权利要求20

21任一所述的数据处理装置,其中所述张量数据的形状信息指示包括多个数据块的N维张量数据的形状的至少一个形状参数,N为正整数,所述形状参数包括以下至少一种:所述张量数据所在的数据存储空间在N个维度方向的至少一个方向上的尺寸、单个数据块的存储区域在N个维度方向的至少一个方向上的尺寸、所述数据块在N个维度方向的至少一个方向上的分块步长、N个维度方向的至少一个方向上的数据块数量、所述数据块在N个维度方向的至少一个方向上的整体步长。24.根据权利要求1

23任一所述的数据处理装置,其中所述融合指令中包括操作模式位来指示所述融合指令为归并排序累加处理操作,或者所述融合指令本身指示所述归并排序累加处理操作。25.一种芯片,包括根据权利要求1

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1