【技术实现步骤摘要】
模型训练处理方法、装置、计算机设备及介质
本申请涉及数据处理
,尤其涉及一种模型训练处理方法、装置、计算机设备及介质。
技术介绍
深度神经网络已成功应用于很多领域,包括图像识别、纹理分类、语音识别等领域。近年来,深度神经网络由于采用更深的网络架构和更大的训练样本集来进行训练,所以在性能上有了显著的提升。针对深度神经网络训练的情况,在实现本申请的过程中,专利技术人发现现有技术至少存在如下问题:深度神经网络学习需要花费太高的时间成本,深度神经网络学习动辄就几个小时甚至花费几天时间来进行,一旦算法出现问题,就要重新训练深度神经网络学习模型,模型训练的效率极低。因此,有必要提供一种模型训练处理方法,能够减少模型训练所需时间,提高模型训练效率。
技术实现思路
鉴于以上内容,有必要提出一种模型训练处理方法、模型训练处理装置、计算机设备及介质,能够减少模型训练所需时间,提高模型训练效率。本申请实施例第一方面提供一种模型训练处理方法,所述模型训练处理方法包括:当接收到模型训练请求时,获取目标服务器对应的附属服务器;计算所述附属服务器的最优训练数量,并基于所述最优训练数量向每一所述附属服务器分配所述模型训练请求;检测所述附属服务器是否输出训练应答消息;当检测结果为所述附属服务器未输出训练应答消息时,确定分配至未输出训练应答消息的目标附属服务器的附属模型训练请求,并将所述附属模型训练请求输出至对应所述目标附属服务器的目标从属节点中;采集每一所述附属 ...
【技术保护点】
1.一种模型训练处理方法,其特征在于,所述模型训练处理方法包括:/n当接收到模型训练请求时,获取目标服务器对应的附属服务器;/n计算所述附属服务器的最优训练数量,并基于所述最优训练数量向每一所述附属服务器分配所述模型训练请求;/n检测所述附属服务器是否输出训练应答消息;/n当检测结果为所述附属服务器未输出训练应答消息时,确定分配至未输出训练应答消息的目标附属服务器的附属模型训练请求,并将所述附属模型训练请求输出至对应所述目标附属服务器的目标从属节点中;/n采集每一所述附属服务器的模型训练结果,并检测所述模型训练结果中是否存在异常项;/n当检测结果为所述模型训练结果中存在异常项时,基于所述异常项修改目标训练模型,并根据所述模型训练结果动态调整所述附属服务器的训练数量以重新训练所述目标训练模型。/n
【技术特征摘要】
1.一种模型训练处理方法,其特征在于,所述模型训练处理方法包括:
当接收到模型训练请求时,获取目标服务器对应的附属服务器;
计算所述附属服务器的最优训练数量,并基于所述最优训练数量向每一所述附属服务器分配所述模型训练请求;
检测所述附属服务器是否输出训练应答消息;
当检测结果为所述附属服务器未输出训练应答消息时,确定分配至未输出训练应答消息的目标附属服务器的附属模型训练请求,并将所述附属模型训练请求输出至对应所述目标附属服务器的目标从属节点中;
采集每一所述附属服务器的模型训练结果,并检测所述模型训练结果中是否存在异常项;
当检测结果为所述模型训练结果中存在异常项时,基于所述异常项修改目标训练模型,并根据所述模型训练结果动态调整所述附属服务器的训练数量以重新训练所述目标训练模型。
2.根据权利要求1所述的模型训练处理方法,其特征在于,所述当接收到模型训练请求时,获取目标服务器对应的附属服务器包括:
解析所述模型训练请求,得到对应所述模型训练请求的目标路由信息;
根据所述目标路由信息确定目标应用;
获取对应所述目标应用的目标服务器集群;
获取所述目标服务器集群中的目标服务器与附属服务器。
3.根据权利要求1所述的模型训练处理方法,其特征在于,所述获取目标服务器对应的附属服务器还包括:
解析所述模型训练请求,得到对应目标训练模型的训练数量;
确定所述训练数量对应的训练数量级;
根据所述训练数量级确定附属服务器的数量。
4.根据权利要求1所述的模型训练处理方法,其特征在于,所述计算所述附属服务器的最优训练数量包括:
获取对应每一附属服务器的数据处理能力;
获取所述模型训练请求携带的对应目标训练模型的训练数量;
根据所述数据处理能力与所述训练数量计算每一所述附属服务器的最优训练数量。
5.根据权利要求1所述的模型训练处理方法,其特征在于,所述基于所述最优训练数量分配所述模型训练请求包括:
获取所述附属服务器的数量与每一所述附属服务器的最优训练数量;
基于所述附属服务器的数量与所述最优训练数量拆分所述模型训练请求,得到若干个附属模型训练请求;
将所述附属模型训练请求分配至对应的附属服务器。
6.根据权利要求1所述的模型训...
【专利技术属性】
技术研发人员:张山,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。