【技术实现步骤摘要】
公开总体上涉及存储器系统,并且更具体地涉及用于人工智能模型的压缩的装置和方法。
技术介绍
1、本
技术介绍
部分仅意图提供上下文,并且本部分中的任何构思的公开不构成对所阐述的构思是现有技术的承认。
2、人工智能(ai)工作负载需要提供高吞吐量和低延迟的存储解决方案,以适应相对大的数据集的快速处理。高吞吐量确保数据可被快速读取和写入。低延迟保证快速数据访问,这对于实时的ai应用是必不可少的。然而,ai的激增导致对数据移动带宽和数据存储容量的提高的需求快速增加,这使得数据中心和相关装置难以跟上需求。
3、本
技术介绍
部分中公开的以上信息仅用于增强对公开的背景的理解,因此该信息可包含不构成现有技术的信息。
技术实现思路
1、在各种实施例中,在此描述的包括用于人工智能模型的压缩的系统和方法的系统、方法和设备。在一些方面,在此描述的技术涉及一种方法,所述方法包括:基于对数据的分布的分析对数据进行分类;基于数据并且基于根据所述分类选择的压缩算法来生成压缩的数据;以及将压缩的数据存储在
本文档来自技高网...【技术保护点】
1.一种用于人工智能模型的压缩的方法,包括:
2.根据权利要求1所述的方法,还包括:基于选择的压缩算法来生成地址边界信息。
3.根据权利要求2所述的方法,还包括:存储地址边界信息与压缩算法之间的映射。
4.根据权利要求2所述的方法,其中,地址边界信息基于压缩的数据被存储在存储装置中的地址。
5.根据权利要求1所述的方法,还包括:基于数据来生成直方图。
6.根据权利要求1所述的方法,其中,数据包括人工智能模型的权重,并且所述方法还包括:基于人工智能模型的权重来生成直方图。
7.根据权利要求6所述的方
...【技术特征摘要】
1.一种用于人工智能模型的压缩的方法,包括:
2.根据权利要求1所述的方法,还包括:基于选择的压缩算法来生成地址边界信息。
3.根据权利要求2所述的方法,还包括:存储地址边界信息与压缩算法之间的映射。
4.根据权利要求2所述的方法,其中,地址边界信息基于压缩的数据被存储在存储装置中的地址。
5.根据权利要求1所述的方法,还包括:基于数据来生成直方图。
6.根据权利要求1所述的方法,其中,数据包括人工智能模型的权重,并且所述方法还包括:基于人工智能模型的权重来生成直方图。
7.根据权利要求6所述的方法,其中,数据的分布是基于所述直方图。
8.根据权利要求1所述的方法,其中,
9.一种用于人工智能模型的压缩的方法,包括:
10.根据权利要求9所述的方法,其中,确定解压缩算法的步骤基于将压缩的数据的地址和与解压缩算法相关联的边界地址进行比较,并且基于所述比较来识...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。