【技术实现步骤摘要】
一种模型的端侧部署方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种模型的端侧部署方法、装置、设备及存储介质。
技术介绍
[0002]随着人工智能技术的发展,各类相关模型的应用也越来越广泛。为了提高模型的训练效率,相关技术在云侧对模型进行训练,然后将训练获得的预测模型部署至端侧进行具体的业务预测。
[0003]然而,针对上述由云侧和端侧组成的框架,存在平台间的割裂现象,即各平台框架往往有着自己对应的端侧部署环境,且平台之间并不互通,就导致了最终模型泛化效果的千差万别,且模型部署成本较高。
技术实现思路
[0004]本申请实施例提供了一种模型的端侧部署方法、装置、设备及存储介质,用于统一模型的泛化效果并降低模型部署成本。
[0005]一方面,本申请实施例提供了一种模型的端侧部署方法,应用于云侧,包括:
[0006]接收端侧发送的模型部署请求;
[0007]基于所述模型部署请求,从模型仓库中获取相应的原始模型;
[0008]将所述原始模型转化为通用格式的目标模型,并对所述目标模型加密,获得加密模型文件;
[0009]将所述加密模型文件、所述目标模型对应的推理环境依赖和任务调度代码发送至端侧,以使所述端侧基于所述推理环境依赖和所述任务调度代码,生成目标推理环境;对所述加密模型文件解密,获得所述目标模型,并在所述目标推理环境中运行所述目标模型进行业务预测,获得业务预测结果。
[0010]本申请实施例中,在云侧进行模型训练 ...
【技术保护点】
【技术特征摘要】
1.一种模型的端侧部署方法,应用于云侧,其特征在于,包括:接收端侧发送的模型部署请求;基于所述模型部署请求,从模型仓库中获取相应的原始模型;将所述原始模型转化为通用格式的目标模型,并对所述目标模型加密,获得加密模型文件;将所述加密模型文件、所述目标模型对应的推理环境依赖和任务调度代码发送至端侧,以使所述端侧基于所述推理环境依赖和所述任务调度代码,生成目标推理环境;对所述加密模型文件解密,获得所述目标模型,并在所述目标推理环境中运行所述目标模型进行业务预测,获得业务预测结果。2.根据权利要求1所述的方法,其特征在于,所述推理环境依赖包括运行所述目标模型所需的算子列表,所述算子列表是将所述原始模型转化为所述目标模型的过程中记录的。3.根据权利要求1所述的方法,其特征在于,所述对所述目标模型加密,获得加密模型文件,包括:将所述目标模型划分为多个文件分片,并采用加密因子对每个文件分片进行加密,获得所述加密模型文件。4.根据权利要求3所述的方法,其特征在于,所述采用加密因子对每个文件分片进行加密,获得所述加密模型文件,包括:基于随机数和原始加密串,生成加密密钥;针对所述多个文件分片中的第一文件分片,采用所述加密密钥对所述第一文件分片进行加密,获得第一加密文件内容,并在所述第一加密文件内容的头部添加所述随机数,以及在所述第一加密文件内容的尾部添加相应的文件校验码,获得第一加密分片;针对除所述第一文件分片之外的每个第二文件分片,采用所述加密密钥对所述第二文件分片进行加密,获得第二加密文件内容,并在所述第二加密文件内容的尾部添加相应的文件校验码,获得第二加密分片;基于所述第一加密分片和获得的至少一个第二加密分片,获得所述加密模型文件。5.一种模型的端侧部署方法,应用于端侧,其特征在于,包括:向云侧发送模型部署请求,以使所述云侧基于所述模型部署请求,从模型仓库中获取相应的原始模型;以及将所述原始模型转化为通用格式的目标模型,并对所述目标模型加密,获得加密模型文件;接收所述云侧发送的所述加密模型文件、所述目标模型对应的推理环境依赖和任务调度代码;基于所述推理环境依赖和所述任务调度代码,生成目标推理环境;对所述加密模型文件解密,获得所述目标模型,并在所述目标推理环境中运行所述目标模型进行业务预测,获得业务预测结果。6.根据权利要求5所述的方法,其特征在于,所述加密模型文件中包括第一加密分片和至少一个第二加密分片;所述对所述加密模型文件解密,获得所述目标模型,包括:从所述第一加密分片的头部获得随机数,并基于所述随机数和原始加密串,生成解密密钥;
对所述第一加密分片的尾部中的文件校验码进行校验,并在校验通过时,采用所述解密密钥对所述第一加密分片中的第一加密文件内容解密,获得第一文件分片;针对每个第二加密分片,对所述第二加密分片的尾部中的文件校验码进行校验,并在校验通过时,采用所述解密密钥对所述第二加...
【专利技术属性】
技术研发人员:王伟鹏,卞凯,刘猛,冀乃庚,康家梁,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。