用于人工智能模型的压缩的装置和方法制造方法及图纸

技术编号：45534840 阅读：15 留言：0更新日期：2025-06-13 17:35

提供用于人工智能模型的压缩的装置和方法。在一个或多个示例中，所述方法包括：基于对数据的分布的分析对数据进行分类；基于数据并且基于所述分类选择的压缩算法来生成压缩的数据；以及将压缩的数据存储在存储装置中。在一个或多个示例中，所述方法包括：基于针对压缩的数据的请求来识别与压缩的数据相关联的地址；基于所述地址确定解压缩算法；以及使用确定的解压缩算法对压缩的数据进行解压缩。

全部详细技术资料下载

【技术实现步骤摘要】

公开总体上涉及存储器系统，并且更具体地涉及用于人工智能模型的压缩的装置和方法。

技术介绍

1、本
技术介绍
部分仅意图提供上下文，并且本部分中的任何构思的公开不构成对所阐述的构思是现有技术的承认。

2、人工智能（ai）工作负载需要提供高吞吐量和低延迟的存储解决方案，以适应相对大的数据集的快速处理。高吞吐量确保数据可被快速读取和写入。低延迟保证快速数据访问，这对于实时的ai应用是必不可少的。然而，ai的激增导致对数据移动带宽和数据存储容量的提高的需求快速增加，这使得数据中心和相关装置难以跟上需求。

3、本
技术介绍
部分中公开的以上信息仅用于增强对公开的背景的理解，因此该信息可包含不构成现有技术的信息。

技术实现思路

1、在各种实施例中，在此描述的包括用于人工智能模型的压缩的系统和方法的系统、方法和设备。在一些方面，在此描述的技术涉及一种方法，所述方法包括：基于对数据的分布的分析对数据进行分类；基于数据并且基于根据所述分类选择的压缩算法来生成压缩的数据；以及将压缩的数据存储在存储装置中。

本文档来自技高网...

【技术保护点】

1.一种用于人工智能模型的压缩的方法，包括：

2.根据权利要求1所述的方法，还包括：基于选择的压缩算法来生成地址边界信息。

3.根据权利要求2所述的方法，还包括：存储地址边界信息与压缩算法之间的映射。

4.根据权利要求2所述的方法，其中，地址边界信息基于压缩的数据被存储在存储装置中的地址。

5.根据权利要求1所述的方法，还包括：基于数据来生成直方图。

6.根据权利要求1所述的方法，其中，数据包括人工智能模型的权重，并且所述方法还包括：基于人工智能模型的权重来生成直方图。

7.根据权利要求6所述的方法，其中，数据的分布...

【技术特征摘要】

1.一种用于人工智能模型的压缩的方法，包括：

2.根据权利要求1所述的方法，还包括：基于选择的压缩算法来生成地址边界信息。

3.根据权利要求2所述的方法，还包括：存储地址边界信息与压缩算法之间的映射。

4.根据权利要求2所述的方法，其中，地址边界信息基于压缩的数据被存储在存储装置中的地址。

5.根据权利要求1所述的方法，还包括：基于数据来生成直方图。

6.根据权利要求1所述的方法，其中，数据包括人工智能模型的权重，并且所述方法还包括：基于人工智能模型的权重来生成直方图。

7.根据权利要求6所述的方法，其中，数据的分布是基于所述直方图。

8.根据权利要求1所述的方法，其中，

9.一种用于人工智能模型的压缩的方法，包括：

10.根据权利要求9所述的方法，其中，确定解压缩算法的步骤基于将压缩的数据的地址和与解压缩算法相关联的边界地址进行比较，并且基于所述比较来识...

【专利技术属性】
技术研发人员：金宗贤，郑秀吉，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人