一种神经网络交互式自动训练系统和方法技术方案

技术编号:27744566 阅读:15 留言:0更新日期:2021-03-19 13:38
本发明专利技术公开了一种神经网络交互式自动训练系统和方法,所述系统包括数据存储组件、数据标注组件、模型训练组件和模型部署组件;数据标注组件用于对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件;模型训练组件用于基于所述标注文件自动进行神经网络训练并生成训练好的已训练模型;模型部署组件用于将所述已训练模型部署为在线推理服务;本发明专利技术用户在神经网络交互式自动训练系统中进行数据标注,标注结果即可用于模型训练,训练结果可以一键部署为在线服务,以实现从原始数据到推理服务的全自动化流程。

【技术实现步骤摘要】
一种神经网络交互式自动训练系统和方法
本专利技术属于人工智能
,尤其涉及一种神经网络交互式自动训练系统和方法。
技术介绍
现有神经网络自动学习方法基本针对神经网络训练方面,其采用超参调优、神经网络架构搜索等方法在通用的基准数据集上进行训练,并报告在这些数据集上的评估结果。这些方法在学术研究中应用广泛,但在实际生产应用中存在以下问题:自动化范围有限。大多数现有神经网络自动学习是针对训练而言的,往往只能在若干通用的基准数据集上进行,这是因为不同算法的数据处理方式未必一致、不同数据集的标注格式不尽相同,这导致现有神经网络自动学习很难应用到实际生产环境的数据集中。另外,这些自动学习方法仅仅生成训练好的模型文件,而模型部署本身仍需要一定的专业知识,这进一步增加了自动学习算法应用的困难。数据集固定。基准数据集的诞生旨在提供一个相对公平的算法评判标准,但并非算法开发的最终目的。现有神经网络自动学习算法过于依赖一些基准数据集,例如一些图像分类架构搜索算法在数据量稍小、图像分辨率较低的CIFAR100上搜索出的网络无法迁移到数据量更大、分辨率更大的ImageNet数据集上,反之亦然。更重要的是,数据是随生成业务发展不断变动的,其更新周期可能小到一天或者小时,这比现有自动学习方法的训练周期(几天/几月)要短得多。现有自动学习方法无法及时利用新数据,花费较常时间训练的模型可能已经脱离实际生成环境需求。训练过程难以干预。当前主流的自动学习方法基本可以分为超参调优和架构搜索,超参调优通过贝叶斯等算法不断尝试使用一组超参进行训练,通过超参组合/训练效果来对超参组合优劣进行建模。架构搜索算法一般采用强化学习或进化算法,通过不断调整网络结构周而复始地训练。这些方法的训练过程没有整体进度,超参调优和架构搜索可以无限进行下去,且在训练中断后往往不能像单一模型那样恢复断点进度。这对于生产开发而言过于黑盒,难以干预。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
专利技术的主要目的在于提供一种神经网络交互式自动训练系统和方法,旨在解决上述
技术介绍
中提到的现有技术。所述神经网络交互式自动训练系统包括数据存储组件、数据标注组件、模型训练组件和模型部署组件:所述数据标注组件,用于对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件;所述模型训练组件,用于基于所述标注文件自动进行神经网络训练并生成训练好的已训练模型;所述模型部署组件,用于将所述已训练模型部署为在线推理服务;所述数据存储组件,用于存储所述生成的标注文件和所述已训练模型。此外,为实现上述目的,本专利技术还提出一种神经网络交互式自动训练方法,所述方法包括以下步骤:调用数据标注组件对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件,并将所述数据标注组件存储于数据存储组件;由模型训练组件根据所述标注文件自动进行神经网络训练,生成训练好的已训练模型,并将所述已训练模型输入至所述模型部署组件;调用模型部署组件将所述已训练模型部署为在线推理服务。本专利技术的有益效果在于:用户在神经网络交互式自动训练系统中进行数据标注,标注结果即可用于模型训练,训练结果可以一键部署为在线服务,以实现从原始数据到推理服务的全自动化流程。附图说明图1是根据本专利技术实施例的神经网络交互式自动训练系统组件示意图;图2是根据本专利技术实施例的神经网络交互式自动训练方法的流程示意图;图2-1是根据本专利技术涉及数据标注实施例的流程示意图;图3是根据本专利技术涉及模型自动训练实施例的模块示意图;图3-1是根据本专利技术实施例的模型训练组件中的整体规划模块对应的方法流程示意图;图3-2是根据本专利技术实施例的模型训练组件中的数据检测模块对应的方法流程示意图;图3-3是根据本专利技术实施例的模型训练组件中的模型调度模块对应的方法流程示意图;图3-4是根据本专利技术实施例的模型训练组件中的模型训练模块对应的方法流程示意图;图4是根据本专利技术实施例的模型部署组件对应的方法流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。专业术语解释说明:首先解释神经网络和神经网络的训练。神经网络算法是一种以人工神经网络为架构,对数据进行表征学习的算法。神经网络架构即神经网络参数及其关系的结构,神经网络的训练即使用一组超参数对神经网络进行迭代训练得到神经网络参数的估计值。神经网络的超参数包括但不限于神经网络的优化算法、学习率、损失函数等。神经网络的训练流程以成批的输入数据/输出数据的数据对传入神经网络算法,以神经网络的预测输出与输出数据的误差作为损失函数,以梯度下降或类梯度下降的迭代方法进行训练,以损失函数下降到阈值或神经网络参数的变化幅度达到阈值作为训练结束的标志,最终得到的神经网络结构和参数集合作为神经网络模型。非神经网络领域专家可通过自动超参调优算法或架构搜素算法在给定数据集的情况下自动训练出一个效果较好的模型。自动超参调优算法基于一定策略尝试多组超参,在神经网络架构基本不变的情况下找到一组效果最好的超参并训练得到相应的神经网络模型;架构搜索算法基于一定策略,通过不断调整神经网络架构,在超参基本不变的情况下找到神经网络的最佳架构并训练得到相应的神经网络模型。神经网络训练中的数据对一般为输入数据和标注,其数据格式与特定任务有关。例如,图像分类任务的输入数据为图片,标注为该图片对应的类别标签。在进行神经网络训练之前,需要准备多条样本数据,每条样本数据包括上述的一个数据对。可理解的是,数据准备和标注是独立于模型训练的流程,但却是执行训练的必备条件。神经网络训练的结果为神经网络模型。神经网络模型在计算机中一般以神经网络参数及结构的序列化文件进行存储,该文件的格式与神经网络算法的实现方式和使用的框架有关。例如,使用TensorFlow框架训练的神经网络模型文件一般为pb文件。使用训练好的神经网络模型对新数据进行预测的过程称为推理。可理解的是,模型推理是独立于模型训练的流程,但却是模型应用于解决实际问题的必要流程。神经网络交互式自动训练的系统实施例首先将参照附图描述根据本专利技术实施例提出的神经网络交互式自动训练系统。参考图1,图1为本专利技术一个实施例的用于神经网络交互式自动训练的系统。如图1所示,该系统10包含:数据存储组件100、数据标注组件200、模型自动训练组件300、模型部署组件400和用户交互组件500。数据标注组件200;用于对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件;模型训练组件300,用于基于所述标注文件自动进行神经网络训练并生成训练好的已训练模型;模型部署组件400组件,用于本文档来自技高网
...

【技术保护点】
1.一种神经网络交互式自动训练系统,其特征在于,所述系统包括数据存储组件、数据标注组件、模型训练组件和模型部署组件:/n所述数据标注组件,用于对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件;/n所述模型训练组件,用于基于所述标注文件自动进行神经网络训练并生成训练好的已训练模型;/n所述模型部署组件,用于将所述已训练模型部署为在线推理服务;/n所述数据存储组件,用于存储所述生成的标注文件和所述已训练模型。/n

【技术特征摘要】
1.一种神经网络交互式自动训练系统,其特征在于,所述系统包括数据存储组件、数据标注组件、模型训练组件和模型部署组件:
所述数据标注组件,用于对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件;
所述模型训练组件,用于基于所述标注文件自动进行神经网络训练并生成训练好的已训练模型;
所述模型部署组件,用于将所述已训练模型部署为在线推理服务;
所述数据存储组件,用于存储所述生成的标注文件和所述已训练模型。


2.如权利要求1所述的系统,其特征在于,所述数据存储组件包含数据集目录,所述数据存储组件中的数据集目录用于存储用户预先指定的数据集,所述数据集目录与任务类型存在对应关系;
所述数据标注组件,还用于响应用户选定的目标任务类型,确定与所述目标任务类型对应的目标数据集目录,针对所述目标任务类型提供基于与所述任务类型相应的界面的标注服务,对所述目标数据集目录中的数据集进行展示;生成所述目标任务类型对应的数据集的标注文件,将所述标注文件保存至所述数据存储组件。


3.如权利要求2所述的系统,其特征在于,所述模型训练组件包括整体规划模块、数据检测模块、数据加载模块、模型训练模块和模型保存模块;
所述数据检测模块,用于检测位于数据集目录的数据集信息,并对所述数据集进行初步处理;其中,所述数据检测模块提取的数据集信息包含原始数据文件路径或预处理数据文件路径,用于表征数据集情况的信息,所述数据集情况的信息因任务类型而异,所述数据集情况的信息被所述数据检测模块传递至所述整体规划模块;
所述整体规划模块,用于接收规划训练流程信息,基于所述规划训练流程信息向所述模型训练组件中的其他模块发出指令以执行特定的任务;其中,所述规划训练流程信息包括任务类型、数据集路径、评估指标、评估指标下限、训练时长上限,以及待恢复模型路径中的至少一项;其中,所述整体规划模块根据当前数据集信息和/或历史数据集信息生成当前数据集的id,所述数据集id用于界定数据是否发生质变的标志;所述数据加载模块,用于从数据集信息中加载训练所需的数据并执行与指定算法相关的数据的预处理,得到预处理数据集;
所述模型调度模块,用于规划模型训练流程,其中,每一种任务类型都有对应的默认训练流程;其中,所述模型调度模块向所述模型训练模块发送的数据集信息与所述整体规划模块向所述模型调度模块发送的数据集信息相同;所述模型训练模块,用于根据所述指定算法的算法信息和数据集信息构建神经网络,加载并对所述预处理数据集进行训练,其中,所述模型训练模块向所述模型调度模块返回的数据集信息为数据集id。


4.如权利要求1所述的系统,其特征在于,所述模型部署组件,用于从所述数据存储组件中获取已训练模型;在所述已训练模型为首次被获取且所述已训练模型不需要更新时,使用神经网络推理引擎对所述已训练模型进行加载,并将所述已训练模型部署为推理服务。


5.一种神经网络交互式自动训练方法,其特征在于,所述方法包括以下步骤:
调用数据标注组件对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件,并将所述数据标注组件存储于数据存储组件;
由模型训练组件根据所述标注文件自动进行神经网络训练,生成训练好的已训练模型,并将所述已训练模型输入至所述模型部署组件;
调用模型部署组件将所述已训练模型部署为在线推理服务。


6.如权利要求5所述的自动训练方法,其特征在于,所述对用户提供的原始数据集进行标注,生成所述原始数据集的标注文件的步骤,具体包括:
响应用户选定的目标任务类型,确定与所述目标任务类型对应的目标数据集目录;
针对所述目标任务类型提供基于与所述任务类型相应的界面的标注服务,对所述目标数据集目录中的数据集进行展示;
生成所述目标任务类型对应的数据集的标注文件。


7.如权利要求5所述的自动训练方法,其特征在于,所述模型训练组件包括整体规划模块、数据检测模块、数据加载模块、模型调度模块、模型训练模块和模型保存模块;
所述模型训练组件根据所述标注文件自动进行神经网络训练,生成训练好的已训练模型的步骤,具体包括:
调用所述数据检测模块检测位于数据集目录的数据集信息,并对所述数据集进行初步处理;其中,所述数据检测模块提取的数据集信息包含原始数据文件路径或预处理数据文件路径,用于表征数据集情况的信息,所述数据集情况的信息因任务类型而异,所述数据集情况的信息被所述数据检测模块传递至所述整体规划模块;
由所述整体规划模块接收规划训练流程信息,基于所述规划训练流程信息向所述模型训练组件中的其他模块发出指令以执行特定的任务;其中,所述规划训练流程信息包括任务类型、数据集路径、评估指标、评估指标下限、训练时长上限,以及待恢复模型路径中的至少一项;其中,所述整体规划模块根据当前数据集信息和/或历史数据集信息生成当前数据集的id,所述数据集id用于界定数据是否发生质变的标志...

【专利技术属性】
技术研发人员:罗明宇徐驰林健
申请(专利权)人:东云睿连武汉计算技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1