一种人工智能训练参数的监测管理系统技术方案

技术编号:38551130 阅读:12 留言:0更新日期:2023-08-22 20:57
本发明专利技术涉及模型训练领域,公开了一种人工智能训练参数的监测管理系统,包括数据库模块、数据处理模块、数据集生成模块、通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块;所述的数据库模块与所述的数据集生成模块连接,所述的数据集生成模块与所述的通信装置通信连接,所述的通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块分别与所述的数据处理模块连接;通过本发明专利技术所提供的技术方案,可以实现为模型训练提供损失值最小的训练集。最小的训练集。最小的训练集。

【技术实现步骤摘要】
一种人工智能训练参数的监测管理系统


[0001]本专利技术涉及模型训练领域,具体是一种人工智能训练参数的监测管理系统。

技术介绍

[0002]批量大小(Batch Size)是在训练神经网络时用于指定每个训练迭代中使用的样本数量。在深度学习中,通常会将训练数据集划分为多个小批量,每个小批量包含一定数量的样本,批量大小对于训练过程和模型的性能具有重要影响,因此,如何在训练模型之初确定损失值最小的批量大小的训练集,是当下行业研究人员需要克服的问题。

技术实现思路

[0003]本专利技术的目的在于克服现有技术的不足,提供一种人工智能训练参数的监测管理系统,包括数据库模块、数据处理模块、数据集生成模块、通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块;所述的数据库模块与所述的数据集生成模块连接,所述的数据集生成模块与所述的通信装置通信连接,所述的通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块分别与所述的数据处理模块连接;所述的数据库模块用于存储样本数据;所述的数据集生成模块用于根据样本数据生成训练集、验证集和测试集;所述的模型训练模块用于根据生成的训练集对模型进行训练;所述的模型训练管理模块用于采集模型训练的输出数据;所述的计算资源监测与调度模块用于根据计算资源进行批量大小的计算;所述的训练损失计算模块用于得到不同的批量大小的训练损失。
[0004]优选的,所述的计算资源监测与调度模块包括内存占用检测模块、可用内存计算模块;所述的内存占用检测模块用于采集模型训练前的内存占用数据,根据内存占用数据可用内存计算模块计算得到最大可用内存,并将最大可用内存数据发送到数据处理模块,数据处理模块根据最大可用内存得到最大批量大小。
[0005]优选的,所述的数据集生成模块包括特征容器生成模块、数据集生成模块;所述的数据集生成模块用于对数据库模块中的样本数据进行筛选,得到筛选后的样本数据,根据筛选后的样本数据生成训练集、验证集和测试集,数据集生成模块根据最大批量大小和设置的批量大小梯度减小值,分别生成多个不同批量大小的训练集,将多个不同批量大小的训练集生成信号发送给所述的特征容器生成模块,特征容器生成模块根据训练集数据生成对应批量大小的特征容器,并分别将不同批量大小的训练集发送到对应批量大小的特征容器,其中的最大批量大小的特征容器通过所述的通信装置与所述的模型训练模块通信连接。
[0006]优选的,所述的模型训练模块根据特征容器中的训练集对模型进行训练,得到模型输出数据,所述的模型输出数据输入到训练损失计算模块。
[0007]优选的,所述的训练损失计算模块根据模型输出数据和损失函数,分别得到每个批量样本数据的损失值,根据所有批量样本数据的损失值,得到对应批量大小的训练集的损失值,将所有训练集中损失值最小的训练集对应的特征容器与所述的模型训练模块通信连接,并删除其余特征容器。
[0008]本专利技术的有益效果是: 通过本专利技术所提供的技术方案,可以实现为模型训练提供损失值最小的训练集,提高模型后续训练的效率。
附图说明
[0009]图1为一种人工智能训练参数的监测管理系统的原理示意图;图2为数据集生成模块的原理示意图。
具体实施方式
[0010]下面结合附图进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。
[0011]为了使本专利技术的目的,技术方案及优点更加清楚明白,结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术,即所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0012]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0013]而且,术语“包括”,“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程,方法,物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程,方法,物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程,方法,物品或者设备中还存在另外的相同要素。
[0014]以下结合实施例对本专利技术的特征和性能作进一步的详细描述。
[0015]如图1所示,一种人工智能训练参数的监测管理系统,包括数据库模块、数据处理模块、数据集生成模块、通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块;所述的数据库模块与所述的数据集生成模块连接,所述的数据集生成模块与所述的通信装置通信连接,所述的通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块分别与所述的数据处理模块连接;所述的数据库模块用于存储样本数据;所述的数据集生成模块用于根据样本数据生成训练集、验证集和测试集;所述的模型训练模块用于根据生成的训练集对模型进行训练;
所述的模型训练管理模块用于采集模型训练的输出数据;所述的计算资源监测与调度模块用于根据计算资源进行批量大小的计算;所述的训练损失计算模块用于得到不同的批量大小的训练损失。
[0016]所述的计算资源监测与调度模块包括内存占用检测模块、可用内存计算模块;所述的内存占用检测模块用于采集模型训练前的内存占用数据,根据内存占用数据可用内存计算模块计算得到最大可用内存,并将最大可用内存数据发送到数据处理模块,数据处理模块根据最大可用内存得到最大批量大小。
[0017]如图2所示,所述的数据集生成模块包括特征容器生成模块、数据集生成模块;所述的数据集生成模块用于对数据库模块中的样本数据进行筛选,得到筛选后的样本数据,根据筛选后的样本数据生成训练集、验证集和测试集,数据集生成模块根据最大批量大小和设置的批量大小梯度减小值,分别生成多个不同批量大小的训练集,将多个不同批量大小的训练集生成信号发送给所述的特征容器生成模块,特征容器生成模块根据训练集数据生成对应批量大小的特征容器,并分别将不同批量大小的训练集发送到对应批量大小的特征容器,其中的最大批量大小的特征容器通过所述的通信装置与所述的模型训练模块通信连接。
[0018]所述的模型训练模块根据特征容器中的训练集对模型进行训练,得到模型输出数据,所述的模型输出数据输入到训练损失计算模块。
[0019]所述的训练损失计算模块根据模型输出数据和损失函数,分别得到每个批量样本数据的损失值,根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人工智能训练参数的监测管理系统,其特征在于,包括数据库模块、数据处理模块、数据集生成模块、通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块;所述的数据库模块与所述的数据集生成模块连接,所述的数据集生成模块与所述的通信装置通信连接,所述的通信装置、模型训练管理模块、模型训练模块、计算资源监测与调度模块、训练损失计算模块分别与所述的数据处理模块连接;所述的数据库模块用于存储样本数据;所述的数据集生成模块用于根据样本数据生成训练集、验证集和测试集;所述的模型训练模块用于根据生成的训练集对模型进行训练;所述的模型训练管理模块用于采集模型训练的输出数据;所述的计算资源监测与调度模块用于根据计算资源进行批量大小的计算;所述的训练损失计算模块用于得到不同的批量大小的训练损失。2.根据权利要求1所述的一种人工智能训练参数的监测管理系统,其特征在于,所述的计算资源监测与调度模块包括内存占用检测模块、可用内存计算模块;所述的内存占用检测模块用于采集模型训练前的内存占用数据,根据内存占用数据可用内存计算模块计算得到最大可用内存,并将最大可用内存数据发送到数据处理模块,数据处理模块根据最大可用内存得到最大批量大小。3.根据权利要求2所述的一种人工智能训...

【专利技术属性】
技术研发人员:吕超星丁鹏吴清忠
申请(专利权)人:北京万界数据科技有限责任公司武汉分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1