【技术实现步骤摘要】
模型训练方法及装置
[0001]本说明书一个或多个实施例涉及终端
,尤其涉及一种模型训练方法及装置。
技术介绍
[0002]为提高模型训练的质量,相关技术中提出了通过云端进行模型训练的方法。在该方法中,各个终端可以基于本地数据对由云端提供的公有模型进行模型训练,进而将训练过程中产生的训练数据上传至云端,以由云端基于获取到的训练数据对公有模型进行更新。
[0003]尽管通过云端训练模型的方式,通过增大训练数据的覆盖面,提高了训练得到的模型的质量,但是同样因为云端需要对终端上传的大量训练数据进行处理,降低了模型训练的效率。
技术实现思路
[0004]有鉴于此,本说明书一个或多个实施例提供一种模型训练方法及装置。
[0005]为实现上述目的,本说明书一个或多个实施例提供技术方案如下:根据本说明书一个或多个实施例的第一方面,提出了一种模型训练系统,包括:云端和多个终端;各个终端部署有与各自所属集群对应的待训练模型;每一终端用于:基于本地数据对本地部署的待训练模型进行模型训练,并将训练产生的训练数 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练系统,包括:云端和多个终端;各个终端部署有与各自所属集群对应的待训练模型;每一终端用于:基于本地数据对本地部署的待训练模型进行模型训练,并将训练产生的训练数据上传至所述云端;所述云端用于:按照各个终端所属的集群,将由各个终端上传的训练数据记录至与各个集群对应的数据集中,并由与各个集群分别对应的训练模块根据相应数据集中包含的训练数据,对各个集群所对应的待训练模型进行更新,得到与各个集群分别对应的更新后模型;以及,将各个集群所对应的更新后模型,作为相应集群在下一次模型更新时的待训练模型部署至各个终端。2.根据权利要求1所述的系统,所述多个终端按照所属地理区域被划分为多个集群;所述云端,按照各个终端所属的集群,将由各个终端上传的训练数据记录至与各个集群对应的数据集中,包括:按照各个终端所属的地理区域,将由各个终端上传的训练数据记录至与各个地理区域对应的数据集中;所述云端,由与各个集群分别对应的训练模块根据相应数据集中包含的训练数据,对各个集群所对应的待训练模型进行更新,包括:由与各个地理区域分别对应的训练模块,根据相应数据集中包含的训练数据,对各个地理区域所对应的待训练模型进行更新;所述云端,将各个集群所对应的更新后模型,作为相应集群在下一次模型更新时的待训练模型部署至各个终端,包括:将与各个地理区域对应的更新后模型,分别下发至部署于相应地理区域的终端,以作为各个终端在下一次模型更新过程中的待训练模型。3.根据权利要求2所述的系统,还包括:多个边缘服务器;其中,所述多个边缘服务器与各个地理区域一一对应;所述每一终端,将训练产生的训练数据上传至所述云端,包括:将训练产生的训练数据上传至所属地理区域所对应的边缘服务器,以由该边缘服务器将接收到的训练数据上传至所述云端;所述云端,将各个集群所对应的更新后模型,作为相应集群在下一次模型更新时的待训练模型部署至各个终端,包括:将与各个地理区域对应的更新后模型,分别下发至与相应地理区域对应的边缘服务器,以由各个边缘服务器将接收到的更新后模型,下发至部署于自身所对应地理区域的终端。4.根据权利要求3所述的系统,每一边缘服务器,还用于:在接收到部署于自身所对应地理区域的终端上传的训练数据的情况下,对接收到的训练数据进行预处理;其中,经由预处理的训练数据被上传至所述云端;所述预处理包含下述至少之一:按照预设过滤条件对接收到的训练数据执行的过滤操作、对接收到的训练数据执行的数据聚合操作。5.根据权利要求3所述的系统,所述云端,还用于:响应于区别于所述多个边缘服务器的其他服务器的注册请求,创建与所述其他服务器对应的训练模块;以及,在所述其他服务器所属地理区域所对应的待更新模型需要更新的情况下,接收所述其他服务器获取的的、由其所对应地理区域中部署的终端上传的训练数据,并由创建的训练模块基于该训练数据对相应待训练模型进行训练,
得到与所述其他服务器对应的更新后模型。6.根据权利要求1所述的系统,所述云端创建有与各个集群分别对应的虚拟机实例;所述云端,由与各个集群分别对应的训练模块根据相应数据集中包含的训练数据,对各个集群所对应的待训练模型进行更新,包括:由各个集群分别对...
【专利技术属性】
技术研发人员:高百川,孙仁恩,魏鹏,张冠男,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。