System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种适用于国产硬件的FP32模型转换方法技术_技高网

当前位置: 首页 > 专利查询>福建亿榕信息技术有限公司专利>正文

一种适用于国产硬件的FP32模型转换方法技术

技术编号：40260661 阅读：9 留言：0更新日期：2024-02-02 22:51

本发明专利技术涉及一种适用于国产硬件的FP32模型转换方法，包括以下步骤：步骤S1:基于原始FP32模型，获取训练数据集；步骤S2:基于训练数据集，构建初始缩放因子和偏置；步骤S3:根据缩放因子，将原始FP32模型转换为INT8模型；步骤S4:基于量化感知训练INT8模型，在训练过程中，根据量化感知精度和量化感知损失的变化情况，动态调整模型参数，直到满足预设精度，则得到最终的INT8模型；步骤S5:将最终的INT8模型部署到国产硬件上。本发明专利技术在保持较高性能的同时，降低模型的精度损失，提高FP32模型在国产AI加速硬件上的运行效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及大模型领域，尤其涉及一种适用于国产硬件的fp32模型转换方法。

技术介绍

1、为了减少对外部技术依赖，国家正在鼓励推广基于自主知识产权的国产ai计算芯片。国产硬件芯片主要优化在int8算力，而深度学习模型参数基本上都是采用32位浮点进行训练的问题。然而，将fp32模型转换为int8模型可能会导致较大的精度损失，尤其是当模型的权重分布在较大的动态范围内时。

2、

技术实现思路

1、为了解决上述问题，本专利技术提供一种适用于国产硬件的fp32模型转换方法，的目的在于,在保持较高性能的同时，降低模型的精度损失，提高fp32模型在国产ai加速硬件上的运行效率。

2、为实现上述目的，本专利技术采用以下技术方案：

3、一种适用于国产硬件的fp32模型转换方法，包括以下步骤：

4、步骤s1:基于原始fp32模型，获取训练数据集；

5、步骤s2:基于训练数据集，构建初始缩放因子和偏置；

6、步骤s3:根据缩放因子，将原始fp32模型转换为int8模型；

7、步骤s4:基于量化感知训练int8模型，在训练过程中，根据量化感知精度和量化感知损失的变化情况，动态调整模型参数，直到满足预设精度，则得到最终的int8模型；

8、步骤s5:将最终的int8模型部署到国产硬件上。

9、进一步的，所述原始fp32模型包括图像分类模型和语言模型，构建初始的缩放因子和偏置项，具体如下：

相关技术

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术