【技术实现步骤摘要】
【国外来华专利技术】矩阵压缩加速器系统和方法
本申请总体涉及在具有不同访问时间的数据存储器之间加速无损压缩数据传输,更具体地涉及在不同访问时序的存储器之间移动大矩阵。
技术介绍
矩阵压缩加速器(MCA)可以应用于可以在以下之间传输非常大的卷积神经网络(CNN)特征图(featuremap)的情况:在数字中央处理单元(CPU)或其他应用控制逻辑(ACL)的控制下的外部数据存储器(EDM);以及在集成矩阵计算引擎(MCE)的控制内的本地数据存储器(LDM),其中矩阵计算运算符(MCO)可以应用于LDM内包含的平铺(tiled)矩阵数据(TMD)。
技术实现思路
在描述的示例中,系统和方法在外部数据存储器(EDM)和本地数据存储器(LDM)之间提供矩阵压缩加速器(MCA)数据传输接口。系统和方法实现用于LDM和EDM之间的数据传输的无损数据压缩(LDC)以及用于EDM和LDM之间的数据传输的无损数据解压缩(LDD)。LDC功能使用LDM内的多阶段过程进行操作,该多阶段过程包括2D到1D数据变换,然后是1D数据压缩。LDD功能使用LDM内的多阶段过程进行操作,该多阶段过程包括1D数据解压缩,然后 ...
【技术保护点】
1.一种矩阵压缩加速器系统,包括:外部数据存储器;本地数据存储器;以及数据传输处理器,所述数据传输处理器被配置为在所述本地数据存储器和所述外部数据存储器之间传输数据;其中,所述数据传输处理器对包含在所述本地数据存储器中的2D未压缩的数据执行2D到1D变换,以生成1D未压缩的数据块;其中,所述ID未压缩的数据块由所述数据传输处理器存储在所述本地数据存储器中;其中,所述ID未压缩的数据块由所述数据传输处理器压缩,以生成压缩的超级块,所述压缩的超级块包括从所述ID未压缩的数据块导出的一个或多个压缩和未压缩的数据字段;其中,所述压缩的超级块由所述数据传输处理器存储在所述本地数据存储 ...
【技术特征摘要】
【国外来华专利技术】2017.02.24 US 62/463,426;2017.02.28 US 62/464,954;1.一种矩阵压缩加速器系统,包括:外部数据存储器;本地数据存储器;以及数据传输处理器,所述数据传输处理器被配置为在所述本地数据存储器和所述外部数据存储器之间传输数据;其中,所述数据传输处理器对包含在所述本地数据存储器中的2D未压缩的数据执行2D到1D变换,以生成1D未压缩的数据块;其中,所述ID未压缩的数据块由所述数据传输处理器存储在所述本地数据存储器中;其中,所述ID未压缩的数据块由所述数据传输处理器压缩,以生成压缩的超级块,所述压缩的超级块包括从所述ID未压缩的数据块导出的一个或多个压缩和未压缩的数据字段;其中,所述压缩的超级块由所述数据传输处理器存储在所述本地数据存储器中;其中,压缩模式向量被生成,所述压缩模式向量包含关于用于每个所述未压缩的数据字段的压缩类型的信息;其中,所述压缩模式向量由所述数据传输处理器存储在所述本地数据存储器中;并且其中,所述压缩的超级块由所述数据传输处理器传输到所述外部数据存储器。2.根据权利要求1所述的矩阵压缩加速器系统,其中经由分散的直接存储器存取数据传输在所述本地数据存储器和所述外部数据存储器之间传输所述压缩的超级块。3.根据权利要求1所述的矩阵压缩加速器系统,其中经由集成的直接存储器存取数据传输在所述本地数据存储器和所述外部数据存储器之间传输所述压缩的超级块。4.根据权利要求1所述的矩阵压缩加速器系统,其中如果包含在每个所述未压缩的数据字段中的数据被单独地确定为预定值,则每个所述未压缩的数据字段单独地被压缩在所述压缩的超级块中。5.根据权利要求1所述的矩阵压缩加速器系统,其中所述压缩模式向量包括用于每个所述未压缩的数据字段的固定位字段宽度的一个数据位,用于每个所述未压缩的数据字段的固定位字段宽度的所述一个数据位均指示是否针对每个所述未压缩的数据字段单独地启用数据压缩。6.根据权利要求1所述的矩阵压缩加速器系统,其中所述压缩模式向量包括用于所述未压缩的数据字段的每个字节的一个数据位,用于所述未压缩的数据字段的每个字节的所述一个数据位均指示是否针对所述未压缩的数据字段的所述每个字节单独地启用数据压缩。7.根据权利要求1所述的矩阵压缩加速器系统,其中所述压缩的超级块具有等于所述外部数据存储器的数据总线宽度的整数倍的固定位宽度。8.根据权利要求1所述的矩阵压缩加速器系统,其中所述外部数据存储器具有128字节的数据总线宽度。9.根据权利要求1所述的矩阵压缩加速器系统,其中所述压缩的超级块包括并入无损数据压缩的数据字段。10.根据权利要求10所述的矩阵压缩加速器系统,执行矩阵压缩加速器方法,所述方法包括:(1)对包含在本地数据存储器中的2D未压缩的数据执行2D到1D变换,以生成1D未压缩的数据块;(2)将所述1D未压缩的数据块存储在所述本地数据存储器中;(3)压缩所述1D未压缩的数据块以生成压缩的超级块,所述压缩的超级块包括从所述1D未压缩的数据块导出的一个或多个压缩和未压缩的数据字段;(4)将所述压缩的超级块存储在所述本地数据存储器中;(5)生成压缩模式向量,所述压缩模式向量包含用于每个所述未压缩的数据字段的压缩类型的信息;(6)将所述压缩模式向量存储在所述本地数据存储器中;以及(7)将所述压缩的超级块传输到所述外部数据存储器。11.一种矩阵解压缩加速器系统,包括:外部数据...
【专利技术属性】
技术研发人员:A·J·雷德芬,D·王,
申请(专利权)人:德克萨斯仪器股份有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。