模型的智能迭代部署方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：26260130 阅读：22 留言：0更新日期：2020-11-06 17:55

本申请涉及一种模型的智能迭代部署方法、装置、计算机设备及存储介质，其中该方法包括：利用MaxCompute对训练数据进行回溯及提取，并返回模型训练所需要的最新数据；对最新数据进行清洗和处理，待清洗处理完成后启动模型训练将清洗后的数据文件发往各个待命的容器训练节点；容器训练节点接收到数据文件后开始并行执行训练；数据库返回每个模型需要的参数信息及等级阀值数据，并通过智能择优模型对模型进行综合评估，选出综合表现最优的模型文件发往控制中心服务器。本发明专利技术极大地缩短了传统模型更新周期，保证了每次部署的模型是由最新数据训练得到，并且是在多次训练的模型中选取效果最优的一个。

全部详细技术资料下载

【技术实现步骤摘要】
模型的智能迭代部署方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用
，特别是涉及一种模型的智能迭代部署方法、装置、计算机设备及存储介质。
技术介绍
随着大数据时代的来临，各行业对数据分析需求的持续增加，通过机器学习高效地对数据进行分析处理，已逐渐成为当今机器学习技术发展的主要推动力。而在整个机器学习过程中，通常需要对机器学习模型进行反复迭代及部署，以达到最优的机器学习效果。在传统技术中，现有的模型迭代的迭代周期较长，无法实现对机器学习模型进行及时更新和修正。其次，现有模型迭代和部署流程比较固定，无法实现迁徙或者复用到其他机器学习项目。除此以外，现有模型迭代和部署流程比较繁琐，整个过程需要大量人工参与调试和监控，导致模型的迭代部署效率低，浪费了不必要的人力成本。
技术实现思路
基于此，有必要针对上述技术问题，提供一种可以实现在无人工参与的情况下自动从云端拉取数据进行模型训练，并通过智能评估挑选最优模型进行自动部署的模型的智能迭代部署方法、装置、计算机设备及存储介质。一种模型的智能迭代部署方法，所述方法包括：控制中心服务器获取通过定时任务发送的模型训练部署请求；利用MaxCompute对训练数据进行回溯及提取，并返回模型训练所需要的最新数据；对所述最新数据进行清洗和处理，待清洗处理完成后启动模型训练将清洗后的数据文件发往各个待命的容器训练节点；容器训练节点接收到数据文件后开始并行执行训练，将训练产生的模型文件、参数信息、最优模型文件、模型...

【技术保护点】
1.一种模型的智能迭代部署方法，其特征在于，所述方法包括：/n控制中心服务器获取通过定时任务发送的模型训练部署请求；/n利用MaxCompute对训练数据进行回溯及提取，并返回模型训练所需要的最新数据；/n对所述最新数据进行清洗和处理，待清洗处理完成后启动模型训练将清洗后的数据文件发往各个待命的容器训练节点；/n容器训练节点接收到数据文件后开始并行执行训练，将训练产生的模型文件、参数信息、最优模型文件、模型择优计算结果及故障日志存入数据库中；/n数据库返回每个模型需要的参数信息及等级阀值数据，并通过智能择优模型对模型进行综合评估，选出综合表现最优的模型文件发往控制中心服务器；/n控制中心服务器接收到所述最优模型文件和等级阀值数据后，将所述最优模型文件和等级阀值数据发往模型部署端等待拉取；/n判断所述最优模型的效果是否小于或等于当前模型的效果，若是则不执行更新，否则正常执行更新。/n

【技术特征摘要】
1.一种模型的智能迭代部署方法，其特征在于，所述方法包括：
控制中心服务器获取通过定时任务发送的模型训练部署请求；
利用MaxCompute对训练数据进行回溯及提取，并返回模型训练所需要的最新数据；
对所述最新数据进行清洗和处理，待清洗处理完成后启动模型训练将清洗后的数据文件发往各个待命的容器训练节点；
容器训练节点接收到数据文件后开始并行执行训练，将训练产生的模型文件、参数信息、最优模型文件、模型择优计算结果及故障日志存入数据库中；
数据库返回每个模型需要的参数信息及等级阀值数据，并通过智能择优模型对模型进行综合评估，选出综合表现最优的模型文件发往控制中心服务器；
控制中心服务器接收到所述最优模型文件和等级阀值数据后，将所述最优模型文件和等级阀值数据发往模型部署端等待拉取；
判断所述最优模型的效果是否小于或等于当前模型的效果，若是则不执行更新，否则正常执行更新。

2.根据权利要求1所述的模型的智能迭代部署方法，其特征在于，在所述控制中心服务器获取通过定时任务发送的模型训练部署请求的步骤之前还包括：
在预设的时间段触发定时任务，向控制中心服务器发送模型训练部署请求。

3.根据权利要求2所述的模型的智能迭代部署方法，其特征在于，所述利用MaxCompute对训练数据进行回溯及提取，并返回模型训练所需要的最新数据的步骤还包括：
MaxCompute根据所述模型训练部署请求中的任务流程依次执行任务；
所述控制中心服务器定时查看MaxCompute数据回溯及数据提取情况；
当MaxCompute执行任务结束后，返回模型训练需要的最新数据。

4.根据权利要求1所述的模型的智能迭代部署方法，其特征在于，所述对所述最新数据进行清洗和处理的步骤还包括：
对训练所需要的最新数据进行清洗和处理，包括缺失值处理、异常值处理、数据分箱处理、数据归一化处理、数据去噪处理及数据增强处理。

5.根据权利要求1所述的模型的智能迭代部署方法，其特征在于，所述通过智能择优模型对模型进行综合评估，选出综合表现最优的模型文件发往控制中心服务器的步骤还包括：
通过计算评估每个模型的效果，包括计算模型预测通过率、误杀率以及是否过拟合，选取综合表现最优的模型文件；
定期检查有无新的最...

【专利技术属性】
技术研发人员：陈岚，雷雨，胡帅，陈志健，
申请(专利权)人：深圳市富之富信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人