【技术实现步骤摘要】
一种共享AI模型训练平台设计方法及装置
[0001]本专利技术涉及人工智能领域,具体提供一种共享AI模型训练平台设计方法及装置。
技术介绍
[0002]机器学习、深度学习领域相关研究人员需不断进行模型训练以期望获得一个效果较好的模型用于实际生产,而模型训练是一个复杂混乱的过程,如何营造一个有序的共享训练平台是本领域技术人员亟待解决的技术问题。
技术实现思路
[0003]本专利技术是针对上述现有技术的不足,提供一种实用性强的共享AI模型训练平台设计方法。
[0004]本专利技术进一步的技术任务是提供一种设计合理,安全适用的共享AI模型训练平台设计装置。
[0005]本专利技术解决其技术问题所采用的技术方案是:
[0006]一种共享AI模型训练平台设计方法,具有如下步骤:
[0007]S1、终端用户在云端创建用户并声明所在组织,其余用户加入组织即可,第一个创建组织的用户默认为管理员,用户创建完成后生成节点接入指令包含云端服务地址及注册校验密钥供边缘节点注册时使用;
[000 ...
【技术保护点】
【技术特征摘要】
1.一种共享AI模型训练平台设计方法,其特征在于,具有如下步骤:S1、终端用户在云端创建用户并声明所在组织,其余用户加入组织即可,第一个创建组织的用户默认为管理员,用户创建完成后生成节点接入指令包含云端服务地址及注册校验密钥供边缘节点注册时使用;S2、具备GPU算力资源的边缘运行生成的注册指令成为组织下的子节点供组织所有用户使用,注册完成后云端可查看节点算力使用情况及所涉及到占用进程;S3、用户上传已标注完成的标准化格式数据,数据集同一组织内所有用户均可查看并使用,不同组织的无法查看及使用。2.根据权利要求1所述的一种共享AI模型训练平台设计方法,其特征在于,在步骤S3中,创建训练任务选择所使用的数据集、查看节点算力并选择空闲节点、设置各项参数即可,任务创建完成后既可执行,训练任务完成后自动将结果上传至云端;任务执行时云端服务将数据及参数设置下发至边缘节点中进行训练,训练过程所有结果数据实时回传至云端管理中心。3.根据权利要求1或2所述的一种共享AI模型训练平台设计方法,其特征在于,所述云端的管理中心包括用户管理、数据中心、任务管理、日志监控、节点管理、资源监控和模型管理;所述终端需要在用户管理中注册;所述数据中心存储所述终端用户上传的标准化数据集;所述任务管理管理终端用户所创建的模型训练任务;所述日志监控记录模型训练过程中各重要指标参数变化过程及该任务训练过程中对于算力资源的消耗情况;所述节点管理管理同一组织内具备算力资源的子节点;所述资源监控监控子节点中算力的使用情况;所述模型管理保存训练结果。4.根据权利要求3所述的...
【专利技术属性】
技术研发人员:宋虎,
申请(专利权)人:山东新一代信息产业技术研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。