预训练服务系统及基于预训练服务系统的服务提供方法技术方案

技术编号:33333715 阅读:19 留言:0更新日期:2022-05-08 09:15
本说明书一个或多个实施例提供一种预训练模服务系统及基于预训练服务系统的服务提供方法,所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参数,所述已混淆模型结构代码与所述已混淆模型参数为预先针对原始模型结构代码和原始模型参数进行相关联的混淆处理后生成;所述系统包括:生产者服务模块,用于供模型生产者产出预训练模型;优化者服务模块,用于根据模型优化者提供的微调数据集对所述预训练模型进行优化,并得到优化后模型;消费者服务模块,用于向模型消费者提供针对所述预训练模型和/或所述优化后模型的服务接口,所述预训练模型或所述优化后模型用于对所述模型消费者提供的数据进行推理并输出模型预测结果。理并输出模型预测结果。理并输出模型预测结果。

【技术实现步骤摘要】
预训练服务系统及基于预训练服务系统的服务提供方法


[0001]本说明书一个或多个实施例涉及深度学习领域,尤其涉及一种预训练服务系统及基于预训练服务系统的服务提供方法。

技术介绍

[0002]在人工智能技术飞速发展的背景下,各种大规模预训练模型应运而生,预训练模型所具有的理解、生成和检索等能力已被应用至各行各业并取得了显著成功。但是,由于预训练模型的使用门槛较高,如何降低使用难度,为更多用户提供通过简单操作就可以运用预训练模型的平台,是亟待解决的问题。并且,由于预训练模型具有极强的理解、生成和检索能力,如何避免预训练模型的滥用也是考虑的问题。

技术实现思路

[0003]有鉴于此,本说明书一个或多个实施例提供一种预训练服务系统。
[0004]为实现上述目的,本说明书一个或多个实施例提供技术方案如下:根据本说明书一个或多个实施例的第一方面,提出了一种预训练服务系统,所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参数,所述已混淆模型结构代码与所述已混淆模型参数为预先针对原始模型结构代码和原始模型参数进行相关联的混淆处理后生成;所述预训练服务系统包括:生产者服务模块,用于向模型生产者提供针对预训练数据集的模型预训练功能,并产出相应的预训练模型;优化者服务模块,用于根据模型优化者提供的微调数据集对所述预训练模型进行优化,并得到优化后模型;消费者服务模块,用于向模型消费者提供针对所述预训练模型和/或所述优化后模型的服务接口,所述预训练模型或所述优化后模型用于对所述模型消费者提供的数据进行推理并输出模型预测结果。
[0005]根据本说明书一个或多个实施例的第二方面,提出了一种基于预训练服务系统的服务提供方法,所述预训练服务系统包括生产者服务模块、优化者服务模块和消费者服务模块;所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参数,所述已混淆模型结构代码与所述已混淆模型参数为预先针对原始模型结构代码和原始模型参数进行相关联的混淆处理后生成;所述方法包括:获取访问所述预训练服务系统的目标用户的身份信息,以确定所述目标用户所属的预设用户类型;向所述目标用户开放与其所属的预设用户类型相匹配的服务模块,其中:在所述目标用户为模型生产者的情况下,向所述目标用户开放所述生产者服务模块,所述生产者服务模块用于向所述模型生产者提供针对预训练数据集的模型预训练功能,并产出相应的预训练模型;
在所述目标用户为模型优化者的情况下,向所述目标用户开放所述优化者服务模块,所述优化者服务模块用于根据所述模型优化者提供的微调数据集对所述预训练模型进行优化,并得到优化后模型;在所述目标用户为模型消费者的情况下,向所述目标用户开放所述消费者服务模块,所述消费者服务模块用于向所述模型消费者提供针对所述预训练模型和/或所述优化后模型的服务接口,所述预训练模型或所述优化后模型用于对所述模型消费者提供的数据进行推理并输出模型预测结果。
[0006]在本说明书所提供的技术方案中,通过一种包括生产者服务模块、优化者服务模块和消费者服务模块的预训练服务系统为具有不同身份的用户提供不同类型的服务,降低了预训练模型的使用难度,提高了预训练模型的普适性,为不具有生成预训练模型的能力的模型优化者提供快速便捷地基于预训练模型获取优化后模型的能力,同时,还提供服务接口给模型消费者,使模型消费者可以通过服务接口快速利用获取预训练模型或者优化后模型进行推理并获取模型预测结果。且由于预训练服务系统提供的模型结构代码以及模型参数为已混淆模型结构代码和已混淆模型参数,其在功能上与原始模型结构代码及原始模型参数等价,但是通过已混淆模型结构代码难以复现该预训练模型,使用已混淆结构代码和已混淆模型参数可以避免预训练模型的滥用,从而达到保护预训练模型的效果。
附图说明
[0007]图1是本说明书一示例性实施例提供的一种预训练服务系统的结构示意图;图2是本说明书一示例性实施例提供的一种基于预训练服务系统的服务提供方法的流程示意图;图3是本说明书一示例性实施例提供的一种电子设备的结构示意图;图4是本说明书一示例性实施例提供的一种基于预训练服务系统的服务提供装置示意图。
具体实施方式
[0008]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
[0009]需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
[0010]人工智能(Artificial Intelligence,AI)技术的应用场景的复杂化导致在不同的应用场景中,任务目标、训练数据、问题设定等方面均存在差异。因此,通过向用户提供具有通用性的预训练模型,以使用户在该预训练模型的基础上进行微调以获得符合特定应用
场景的优化后模型的应用模式降低了对训练数据的需求,提升了训练效率,使得更多的中小型企业具备了获得符合特定应用场景的优化后模型的能力,从而推进了AI技术的应用普及。同时,用户还可以根据应用场景选取不同的预训练模型或者服务特定场景的优化后模型利用自己的数据进行推理,从而获取基于选定的预训练模型或者优化后模型的模型输出结果。
[0011]为了方便为具有不同身份类型的用户提供不同种类的基于预训练模型的服务,本说明书一示例性实施例提供一种如图1所示的预训练服务系统,该预训练服务系统包括:生产者服务模块11、优化者服务模块12和消费者服务模块13。其中,生产者服务模块11用于向模型生产者提供针对预训练数据集111的模型预训练功能,并产出相应的预训练模型112;优化者服务模块12,用于根据模型优化者提供的微调数据集121对所述预训练模型112进行优化,并得到优化后模型122;消费者服务模块13,用于向模型消费者提供针对所述预训练模型112和/或所述优化后模型122的服务接口,所述预训练模型112或所述优化后模型122用于对所述模型消费者提供的数据131进行推理并输出模型预测结果132。
[0012]其中,上述模型生产者是指预训练服务系统方的算法开发人员,是预训练模型112的生产者,在本说明书一示例性实施例中,模型生产者基于预训练数据集111利用预训练服务系统提供的模型预训练功能启动分布式预训练并产出预训练模型112,该预训练模型112是预训练服务系统提供人工智能相关服务的基础,其他预训练模型均为由该预训练模型112经修改后获得。
[0013]在本说明书一示例性实施例中,在预训练模型112的预训练过程中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预训练服务系统,其特征在于,所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参数,所述已混淆模型结构代码与所述已混淆模型参数为预先针对原始模型结构代码和原始模型参数进行相关联的混淆处理后生成;所述预训练服务系统包括:生产者服务模块,用于向模型生产者提供针对预训练数据集的模型预训练功能,并产出相应的预训练模型;优化者服务模块,用于根据模型优化者提供的微调数据集对所述预训练模型进行优化,并得到优化后模型;消费者服务模块,用于向模型消费者提供针对所述预训练模型和/或所述优化后模型的服务接口,所述预训练模型或所述优化后模型用于对所述模型消费者提供的数据进行推理并输出模型预测结果。2.如权利要求1所述的系统,其特征在于,所述模型预训练功能用于根据所述预训练数据集训练得到通用预训练模型;其中,所述预训练模型包括以下至少之一:所述通用预训练模型、所述生产者服务模块根据所述通用预训练模型生成的对应于所述模型生产者所指示的下游任务的专用预训练模型。3.如权利要求2所述的系统,其特征在于,所述生产者服务模块还用于:生成所述专用预训练模型对应的代码开发模板;所述优化者服务模块还用于:将所述代码开发模板提供至所述模型优化者;以及,根据所述模型优化者发出的模型修改指令,对所述专用预训练模型的模型结构代码和/或模型参数进行修改。4.如权利要求1所述的系统,其特征在于,所述消费者服务模块用于:通过所述服务接口将所述预训练模型或所述优化后模型部署于所述模型消费者对应的设备,以用于对所述模型消费者提供的数据进行离线推理;或者,通过所述服务接口获取所述模型消费者提供的数据,并调用所述预训练模型或所述优化后模型进行在线推理。5.如权利要求1所述的系统,其特征在于,所述相关联的混淆处理包括:对所述原始模型结构代码中的至少一部分代码进行正向混淆处理,并对所述原始模型参数中与所述至少一部分代码相关的模型参数进行逆向混淆处理。6.如权利要求1所述的系统,其特征在于,所述已混淆模型参数存储在所述预训练服务系统管理的存储空间中。7.如权利要求1所述的系统,其特征在于,所述优化者服务模块还用于:鉴定所述模型优化者是否具有调用所述预训练模型对应的已混淆模型参数的权限;若所述模型优化者具有调用所述已混淆模型参数的权限,则将所述已混淆模型参数与所述已混淆模型结构代码相结合以获取所述预训练模型并提供至所述模型优化者;和/或,所述消费者服务模块还用于:鉴定所述模型消费者是否具有调用所述预训练模型或所述优化后模型对应的已混淆模型参数的权限;若所述模型消费者具有调用所述已混淆模型参数的权限,则将所述已混淆模型参数与所述已混淆模型结构代码相结合以获取所述预训练模型或所述优化后模型并提供至所述模型消费者。
8.如权利要求1所述的系统,其特征在于,所述预训练服务系统针对所述预训练模型或所述优化后模型维护有独立的模型存取代码和模型训练推理代码;其中,所述模型结构代码以及所述模型存取代码由所述预训练服务系统经加密后维护,所述模型训练推理代码由所述预训练服务系统明文维护。9.一种基于预训练服务系统的服务提供方法,其特征在于,所述预训练服务系统包括生产者服务模块、优化者服务模块和消费者服务模块;所述预训练服务系统所维护的模型包括已混淆模型结构代码和已混淆模型参...

【专利技术属性】
技术研发人员:门睿周畅王鹏张一昌林俊旸杨安李永林伟丁铭邹旭杜政晓唐杰杨红霞周靖人
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1