一种机器学习模型的部署方法、系统和可读存储介质技术方案

技术编号：36965418 阅读：49 留言：0更新日期：2023-03-22 19:25

本申请公开了一种机器学习模型的部署方法、系统和可读存储介质，该机器学习模型的部署方法包括：从人工智能开放平台获取机器学习模型，基于机器学习模型的权重数据的分布情况对机器学习模型的权重数据进行压缩，得到压缩后的机器学习模型；将压缩后的机器学习模型发送至待部署的嵌入式设备，以使得嵌入式设备接收压缩后的机器学习模型，将压缩后的机器学习模型的权重数据转换成与压缩前的机器学习模型的权重数据的值域相同的浮点数，并对浮点数进行运算，以完成机器学习模型在嵌入式设备上的轻量级部署。通过上述方式，本申请能够提高机器学习模型的轻量级部署效率。机器学习模型的轻量级部署效率。机器学习模型的轻量级部署效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种机器学习模型的部署方法、系统和可读存储介质

[0001]本申请涉及模型部署
，具体涉及一种机器学习模型的部署方法、系统和可读存储介质。

技术介绍

[0002]目前通过将训练成熟的机器学习模型部署到嵌入式设备中，使得机器学习模型在嵌入式设备中实现应用，然而一般情况下机器学习模型的内存体积都较大，将机器学习模型部署到轻量级(即内存量较小)的嵌入式设备中的效率低，甚至可能无法部署到轻量级的嵌入式设备中，因此如何将机器学习模型高效地部署在轻量级的嵌入式设备成为了亟待解决的问题。

技术实现思路

[0003]本申请提供一种机器学习模型的部署方法、系统和可读存储介质，能够提高机器学习模型的轻量级部署效率。
[0004]为解决上述技术问题，本申请采用的技术方案是：提供一种机器学习模型的部署方法，应用于机器学习模型的部署系统中的压缩装置，该机器学习模型的部署方法包括：从人工智能开放平台获取机器学习模型，基于机器学习模型的权重数据的分布情况对机器学习模型的权重数据进行压缩，得到压缩后的机器学习模型；其中压缩后的机器学习模型的所有权重数据的比特数之和小于压缩前的机器学习模型的所有权重数据的比特数之和；将压缩后的机器学习模型发送至待部署的嵌入式设备，以使得嵌入式设备接收压缩后的机器学习模型，将压缩后的机器学习模型的权重数据转换成与压缩前的机器学习模型的权重数据的值域相同的浮点数，并对浮点数进行运算，以完成机器学习模型在嵌入式设备上的轻量级部署。
[0005]为解决上述技术问题，本申请采用的另一技术方...

【技术保护点】

【技术特征摘要】
1.一种机器学习模型的部署方法，其特征在于，应用于机器学习模型的部署系统中的压缩装置，包括：从人工智能开放平台获取机器学习模型，基于所述机器学习模型的权重数据的分布情况对所述机器学习模型的权重数据进行压缩，得到压缩后的机器学习模型；其中压缩后的机器学习模型的所有权重数据的比特数之和小于压缩前的机器学习模型的所有权重数据的比特数之和；将所述压缩后的机器学习模型发送至待部署的嵌入式设备，以使得所述嵌入式设备接收所述压缩后的机器学习模型，将所述压缩后的机器学习模型的权重数据转换成与压缩前的机器学习模型的权重数据的值域相同的浮点数，并对所述浮点数进行运算，以完成所述机器学习模型在所述嵌入式设备上的轻量级部署。2.根据权利要求1所述的机器学习模型的部署方法，其特征在于，所述基于所述机器学习模型的权重数据的分布情况对所述机器学习模型的权重数据进行压缩的步骤，包括：获取机器学习模型的多个权重数据；对所述多个权重数据进行等间隔划分，得到至少两个权重划分区间；统计每个所述权重划分区间中的权重数据的数量；对每个所述权重划分区间对应的权重数据的数量进行调整，得到所述权重划分区间对应的校准数量数据；基于每个所述权重划分区间对应的校准数量数据，对所述多个权重数据重新进行划分，得到至少两个权重量化区间，以使各个所述权重量化区间中的权重数据的数量均衡；对所述权重量化区间中的权重数据进行量化处理，以使量化后的所有权重数据的比特数之和小于量化前的所有权重数据的比特数之和。3.根据权利要求2所述的机器学习模型的部署方法，其特征在于，所述对每个所述权重划分区间对应的权重数据的数量进行调整，得到所述权重划分区间对应的校准数量数据的步骤，包括：对每个所述权重划分区间对应的权重数据的数量进行数值限制处理与归一化处理，得到所述校准数量数据；或者，对每个所述权重划分区间对应的权重数据的数量进行变换与归一化处理，得到所述校准数量数据；或者，对每个所述权重划分区间对应的权重数据的数量进行数值限制处理，得到第一权重数量数据；对所述第一权重数量数据进行变换与归一化处理，得到所述校准数量数据；或者，对每个所述权重划分区间对应的权重数据的数量进行变换，得到第二权重数量数据；对所述第二权重数量数据进行数值限制处理与归一化处理，得到所述校准数量数据。4.根据权利要求3所述的机器学习模型的部署方法，其特征在于，所述对每个所述权重划分区间对应的权重数据的数量进行数值限制处理的步骤，包括：依次从所有所述权重划分区间对应的权重数据的数量中取出一个权重数据的数量，得到当前数量；判断所述当前数量是否满足预设条件；若是，则不对所述当前数量进行调整；若否，则在所述当前数量落在第一数量范围时，将所述当前数量调整为预设最小数值；
在所述当前数量落在第二数量范围时，不对所述当前数量进行调整；在所述当前数量落在第三数量范围时，将所述当前数量调整为预设最大数值。5.根据权利要求3所述的机器学习模型的部署方法，其特征在于，所述对所述第一权重数量数据进行变换与归一化处理，得到所述校准数量数据的步骤，包括：从预设函数库中选出当前运算函数，并将所述第一权重数量数据输入所述当前运算函数，得到运算统计数据；对所述运算统计数据进行归一化处理，得到所述校准数量数据。6.根据权利要求2所述的机器学习模型的部署方法，其特征在于，所述基于每个所述权重划分区间对应的校准数量数据，对所述多个权重数据重新进行划分，得到至少两个权重量化区间的步骤，包括：对所述校准数量数据进行累加处理，得到累加数组，所述累加数组包括累加值；基于所述累加值、权重最小值、权重最大值以及所述权重划分区间的数量，对所述多个权重数据重新进行划分，得到所述至少两个权重量化区间...

【专利技术属性】
技术研发人员：殷俊，韩建强，陈波扬，吴立，周祥明，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人