【技术实现步骤摘要】
一种神经网络交互式自动训练系统和方法
本专利技术属于人工智能
,尤其涉及一种神经网络交互式自动训练系统和方法。
技术介绍
现有神经网络自动学习方法基本针对神经网络训练方面,其采用超参调优、神经网络架构搜索等方法在通用的基准数据集上进行训练,并报告在这些数据集上的评估结果。这些方法在学术研究中应用广泛,但在实际生产应用中存在以下问题:自动化范围有限。大多数现有神经网络自动学习是针对训练而言的,往往只能在若干通用的基准数据集上进行,这是因为不同算法的数据处理方式未必一致、不同数据集的标注格式不尽相同,这导致现有神经网络自动学习很难应用到实际生产环境的数据集中。另外,这些自动学习方法仅仅生成训练好的模型文件,而模型部署本身仍需要一定的专业知识,这进一步增加了自动学习算法应用的困难。数据集固定。基准数据集的诞生旨在提供一个相对公平的算法评判标准,但并非算法开发的最终目的。现有神经网络自动学习算法过于依赖一些基准数据集,例如一些图像分类架构搜索算法在数据量稍小、图像分辨率较低的CIFAR100上搜索出的网络无法迁移到数据量更大、分辨率更大的ImageNet数据集上,反之亦然。更重要的是,数据是随生成业务发展不断变动的,其更新周期可能小到一天或者小时,这比现有自动学习方法的训练周期(几天/几月)要短得多。现有自动学习方法无法及时利用新数据,花费较常时间训练的模型可能已经脱离实际生成环境需求。训练过程难以干预。当前主流的自动学习方法基本可以分为超参调优和架构搜索,超参调优通过贝叶斯等算法不断尝试使用一 ...
【技术保护点】
1.一种神经网络交互式自动训练系统,其特征在于,所述系统包括数据存储组件、数据标注组件、模型训练组件和模型部署组件:/n所述数据标注组件,用于对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件;/n所述模型训练组件,用于基于所述标注文件自动进行神经网络训练并生成训练好的已训练模型;/n所述模型部署组件,用于将所述已训练模型部署为在线推理服务;/n所述数据存储组件,用于存储所述生成的标注文件和所述已训练模型。/n
【技术特征摘要】
1.一种神经网络交互式自动训练系统,其特征在于,所述系统包括数据存储组件、数据标注组件、模型训练组件和模型部署组件:
所述数据标注组件,用于对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件;
所述模型训练组件,用于基于所述标注文件自动进行神经网络训练并生成训练好的已训练模型;
所述模型部署组件,用于将所述已训练模型部署为在线推理服务;
所述数据存储组件,用于存储所述生成的标注文件和所述已训练模型。
2.如权利要求1所述的系统,其特征在于,所述数据存储组件包含数据集目录,所述数据存储组件中的数据集目录用于存储用户预先指定的数据集,所述数据集目录与任务类型存在对应关系;
所述数据标注组件,还用于响应用户选定的目标任务类型,确定与所述目标任务类型对应的目标数据集目录,针对所述目标任务类型提供基于与所述任务类型相应的界面的标注服务,对所述目标数据集目录中的数据集进行展示;生成所述目标任务类型对应的数据集的标注文件,将所述标注文件保存至所述数据存储组件。
3.如权利要求2所述的系统,其特征在于,所述模型训练组件包括整体规划模块、数据检测模块、数据加载模块、模型训练模块和模型保存模块;
所述数据检测模块,用于检测位于数据集目录的数据集信息,并对所述数据集进行初步处理;其中,所述数据检测模块提取的数据集信息包含原始数据文件路径或预处理数据文件路径,用于表征数据集情况的信息,所述数据集情况的信息因任务类型而异,所述数据集情况的信息被所述数据检测模块传递至所述整体规划模块;
所述整体规划模块,用于接收规划训练流程信息,基于所述规划训练流程信息向所述模型训练组件中的其他模块发出指令以执行特定的任务;其中,所述规划训练流程信息包括任务类型、数据集路径、评估指标、评估指标下限、训练时长上限,以及待恢复模型路径中的至少一项;其中,所述整体规划模块根据当前数据集信息和/或历史数据集信息生成当前数据集的id,所述数据集id用于界定数据是否发生质变的标志;所述数据加载模块,用于从数据集信息中加载训练所需的数据并执行与指定算法相关的数据的预处理,得到预处理数据集;
所述模型调度模块,用于规划模型训练流程,其中,每一种任务类型都有对应的默认训练流程;其中,所述模型调度模块向所述模型训练模块发送的数据集信息与所述整体规划模块向所述模型调度模块发送的数据集信息相同;所述模型训练模块,用于根据所述指定算法的算法信息和数据集信息构建神经网络,加载并对所述预处理数据集进行训练,其中,所述模型训练模块向所述模型调度模块返回的数据集信息为数据集id。
4.如权利要求1所述的系统,其特征在于,所述模型部署组件,用于从所述数据存储组件中获取已训练模型;在所述已训练模型为首次被获取且所述已训练模型不需要更新时,使用神经网络推理引擎对所述已训练模型进行加载,并将所述已训练模型部署为推理服务。
5.一种神经网络交互式自动训练方法,其特征在于,所述方法包括以下步骤:
调用数据标注组件对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件,并将所述数据标注组件存储于数据存储组件;
由模型训练组件根据所述标注文件自动进行神经网络训练,生成训练好的已训练模型,并将所述已训练模型输入至所述模型部署组件;
调用模型部署组件将所述已训练模型部署为在线推理服务。
6.如权利要求5所述的自动训练方法,其特征在于,所述对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件的步骤,具体包括:
响应用户选定的目标任务类型,确定与所述目标任务类型对应的目标数据集目录;
针对所述目标任务类型提供基于与所述任务类型相应的界面的标注服务,对所述目标数据集目录中的数据集进行展示;
生成所述目标任务类型对应的数据集的标注文件。
7.如权利要求5所述的自动训练方法,其特征在于,所述模型训练组件包括整体规划模块、数据检测模块、数据加载模块、模型调度模块、模型训练模块和模型保存模块;
所述模型训练组件根据所述标注文件自动进行神经网络训练,生成训练好的已训练模型的步骤,具体包括:
调用所述数据检测模块检测位于数据集目录的数据集信息,并对所述数据集进行初步处理;其中,所述数据检测模块提取的数据集信息包含原始数据文件路径或预处理数据文件路径,用于表征数据集情况的信息,所述数据集情况的信息因任务类型而异,所述数据集情况的信息被所述数据检测模块传递至所述整体规划模块;
由所述整体规划模块接收规划训练流程信息,基于所述规划训练流程信息向所述模型训练组件中的其他模块发出指令以执行特定的任务;其中,所述规划训练流程信息包括任务类型、数据集路径、评估指标、评估指标下限、训练时长上限,以及待恢复模型路径中的至少一项;其中,所述整体规划模块根据当前数据集信息和/或历史数据集信息生成当前数据集的id,所述数据集id用于界定数据是否发生质变的标志...
【专利技术属性】
技术研发人员:罗明宇,徐驰,林健,
申请(专利权)人:东云睿连武汉计算技术有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。