【技术实现步骤摘要】
预训练服务系统及基于预训练服务系统的服务提供方法
[0001]本说明书一个或多个实施例涉及深度学习领域,尤其涉及一种预训练服务系统及基于预训练服务系统的服务提供方法。
技术介绍
[0002]在人工智能技术飞速发展的背景下,各种大规模预训练模型应运而生,预训练模型所具有的理解、生成和检索等能力已被应用至各行各业并取得了显著成功。但是,由于预训练模型的使用门槛较高,如何降低使用难度,为更多用户提供通过简单操作就可以运用预训练模型的平台,是亟待解决的问题。并且,由于预训练模型具有极强的理解、生成和检索能力,如何避免预训练模型的滥用也是考虑的问题。
技术实现思路
[0003]有鉴于此,本说明书一个或多个实施例提供一种预训练服务系统。
[0004]为实现上述目的,本说明书一个或多个实施例提供技术方案如下:根据本说明书一个或多个实施例的第一方面,提出了一种预训练服务系统,所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参数,所述已混淆模型结构代码与所述已混淆模型参数为预先针对原始模型结构代码和原始模型参数进行相关联的混淆处理后生成;所述预训练服务系统包括:生产者服务模块,用于向模型生产者提供针对预训练数据集的模型预训练功能,并产出相应的预训练模型;优化者服务模块,用于根据模型优化者提供的微调数据集对所述预训练模型进行优化,并得到优化后模型;消费者服务模块,用于向模型消费者提供针对所述预训练模型和/或所述优化后模型的服务接口,所述预训练模型或所述优化后模型用于对所述模型消费者提供的数据进行推 ...
【技术保护点】
【技术特征摘要】
1.一种预训练服务系统,其特征在于,所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参数,所述已混淆模型结构代码与所述已混淆模型参数为预先针对原始模型结构代码和原始模型参数进行相关联的混淆处理后生成;所述预训练服务系统包括:生产者服务模块,用于向模型生产者提供针对预训练数据集的模型预训练功能,并产出相应的预训练模型;优化者服务模块,用于根据模型优化者提供的微调数据集对所述预训练模型进行优化,并得到优化后模型;消费者服务模块,用于向模型消费者提供针对所述预训练模型和/或所述优化后模型的服务接口,所述预训练模型或所述优化后模型用于对所述模型消费者提供的数据进行推理并输出模型预测结果。2.如权利要求1所述的系统,其特征在于,所述模型预训练功能用于根据所述预训练数据集训练得到通用预训练模型;其中,所述预训练模型包括以下至少之一:所述通用预训练模型、所述生产者服务模块根据所述通用预训练模型生成的对应于所述模型生产者所指示的下游任务的专用预训练模型。3.如权利要求2所述的系统,其特征在于,所述生产者服务模块还用于:生成所述专用预训练模型对应的代码开发模板;所述优化者服务模块还用于:将所述代码开发模板提供至所述模型优化者;以及,根据所述模型优化者发出的模型修改指令,对所述专用预训练模型的模型结构代码和/或模型参数进行修改。4.如权利要求1所述的系统,其特征在于,所述消费者服务模块用于:通过所述服务接口将所述预训练模型或所述优化后模型部署于所述模型消费者对应的设备,以用于对所述模型消费者提供的数据进行离线推理;或者,通过所述服务接口获取所述模型消费者提供的数据,并调用所述预训练模型或所述优化后模型进行在线推理。5.如权利要求1所述的系统,其特征在于,所述相关联的混淆处理包括:对所述原始模型结构代码中的至少一部分代码进行正向混淆处理,并对所述原始模型参数中与所述至少一部分代码相关的模型参数进行逆向混淆处理。6.如权利要求1所述的系统,其特征在于,所述已混淆模型参数存储在所述预训练服务系统管理的存储空间中。7.如权利要求1所述的系统,其特征在于,所述优化者服务模块还用于:鉴定所述模型优化者是否具有调用所述预训练模型对应的已混淆模型参数的权限;若所述模型优化者具有调用所述已混淆模型参数的权限,则将所述已混淆模型参数与所述已混淆模型结构代码相结合以获取所述预训练模型并提供至所述模型优化者;和/或,所述消费者服务模块还用于:鉴定所述模型消费者是否具有调用所述预训练模型或所述优化后模型对应的已混淆模型参数的权限;若所述模型消费者具有调用所述已混淆模型参数的权限,则将所述已混淆模型参数与所述已混淆模型结构代码相结合以获取所述预训练模型或所述优化后模型并提供至所述模型消费者。
8.如权利要求1所述的系统,其特征在于,所述预训练服务系统针对所述预训练模型或所述优化后模型维护有独立的模型存取代码和模型训练推理代码;其中,所述模型结构代码以及所述模型存取代码由所述预训练服务系统经加密后维护,所述模型训练推理代码由所述预训练服务系统明文维护。9.一种基于预训练服务系统的服务提供方法,其特征在于,所述预训练服务系统包括生产者服务模块、优化者服务模块和消费者服务模块;所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参...
【专利技术属性】
技术研发人员:门睿,周畅,王鹏,张一昌,林俊旸,杨安,李永,林伟,丁铭,邹旭,杜政晓,唐杰,杨红霞,周靖人,
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。