本申请公开了一种模型训练方法、装置、可读存储介质及电子设备,所述方法包括:获取包括多个人员的数据记录的数据集,所述数据记录包括已知人员的至少一项行为的数据;检测所述数据集中数据记录的属性是否发生变化,所述属性包括数据的类型、单位时间内对应的每种类型的数据的数量;如果数据集中数据记录的属性发生变化,则从所述数据集中获取与变化后的属性对应的训练样本集、验证样本集以及测试样本集;依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型。本申请提供的方案能够自动地对模型进行更新,确保模型与环境的一致性。
Model training method, device, readable storage medium and electronic equipment
【技术实现步骤摘要】
模型训练方法、装置、可读存储介质及电子设备
本申请涉及模型训练
,具体而言,涉及一种模型训练方法、装置、可读存储介质及电子设备。
技术介绍
大数据中包含着大量的信息,潜藏着巨大的价值。通过对大数据进行分析,过滤掉不感兴趣的信息,从而能够获得感兴趣的信息。在大数据处理的过程中,通常会先训练一个模型,从而通过模型来进行相关的数据处理。目前,训练模型时通常是由专业人员来搭建网络结构,然后进行训练。但是随着技术等的发展,数据产生的环境在不断变化,不同类型的数据的价值、数量、质量等对数据分析的结果在不同的时期可能会产生不同的影响,模型的准确度会随着环境的变化而变化,因此,对模型的更新提出了更高的要求。
技术实现思路
为了至少克服现有技术中的上述不足,本申请的目的之一在于提供一种模型训练方法,所述方法包括:获取包括多个人员的数据记录的数据集,所述数据记录包括已知人员的至少一项行为的数据;检测所述数据集中数据记录的属性是否发生变化,所述属性包括数据的类型、单位时间内对应的每种类型的数据的数量;如果数据集中数据记录的属性发生变化,则从所述数据集中获取与变化后的属性对应的训练样本集、验证样本集以及测试样本集;依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型。可选地,所述方法还包括:获取预先配置的模型训练规则,其中,所述模型训练规则包括模型训练采用的算法;所述依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型的步骤包括:依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型,并根据预先配置的模型训练规则进行模型训练,获得所述目标模型。可选地,所述方法还包括:获取用户确定的模型训练方法,其中,所述模型训练方法包括线性回归、梯度下降、多项式回归、学习曲线、线性模型正则化、逻辑回归中的至少一种。可选地,所述依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型,并根据预先配置的模型训练规则进行模型训练,获得所述目标模型的步骤包括:依次将各个训练样本集、验证样本集以及测试样本集输入所述预配置模型,分别采用所述模型训练规则中的算法进行训练,得到每种所述算法对应的子模型;根据每种所述算法对应的子模型获得目标模型。可选地,依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型前,所述方法还包括:如果所述数据的数据类型发生变化,则获取每种类型的数据的比例;根据每种类型的数据的比例获得各个类型的数据的权重系数;根据所述权重系数调整所述预配置模型中对应的网络参数,获得新的预配置模型。可选地,所述依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型的步骤包括:检测硬件资源的状态和/或获取当前时间;判断所述硬件资源的状态是否满足预设硬件条件,和/或所述当前时间是否达到预设开始时间;如果所述硬件资源的状态满足预设硬件条件,和/或所述当前时间达到预设开始时间,则依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型。可选地,所述检测所述数据集中数据记录的属性是否发生变化的步骤包括:获取当前时间段内所产生的数据记录的属性作为第一属性;获取当前时间段前一预设时间段内所述产生的数据记录的属性作为第二属性;判断所述第一属性与所述第二属性是否一致;如果所述第一属性与所述第二属性不一致,则判定所述数据集中数据记录的属性发生变化。本申请的另一目的还在于提供一种模型训练装置,所述装置包括:第一获取模块,用于获取包括多个人员的数据记录的数据集,所述数据记录包括描述已知人员行为的至少一项数据;检测模块,用于检测所述数据集中数据记录的属性是否发生变化,所述属性包括数据的类型、单位时间内对应的每种类型的数据的数量;第二获取模块,用于在数据集中数据记录的属性发生变化时,从所述数据集中获取与变化后的属性对应的训练样本集、验证样本集以及测试样本集;训练模块,用于依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型。本申请的另一目的还在于提供一种可读存储介质,所述可读存储介质存储有可执行程序,处理器在执行所述可执行程序时,实现如本申请任一项所述的方法。本申请的另一目的还在于提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器和所述处理器电性连接,所述存储器中存储有可执行程序,所述处理器在执行所述可执行程序时,实现如本申请任一项所述的方法。相对于现有技术而言,本申请具有以下有益效果:本申请实施例提供的模型训练方法、装置、可读存储介质及电子设备,通过检测环境中数据的变化情况,从而根据数据的变化情况来对数据获取训练样本集、验证样本集以及测试样本集,并根据获取到的训练样本集、验证样本集以及测试样本集来进行模型训练,获得目标模型。本申请由于能够根据环境的变化而选取不同的训练样本集、验证样本集以及测试样本集来进行模型训练,这样,训练出来的目标模型就是与环境一致的,从而能够提高模型识别的准确率。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1是本申请实施例提供的电子设备的结构示意框图;图2是本申请实施例提供的模型训练方法的流程示意图一;图3是本申请实施例提供的模型训练方法的流程示意图二;图4是本申请实施例提供的模型训练方法的流程示意图三;图5是本申请实施例提供的模型训练装置的结构示意框图。图标:100-电子设备;110-模型训练装置;111-第一获取模块;112-检测模块;113-第二获取模块;114-训练模块;120-存储器;130-处理器;140-通信单元。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和本文档来自技高网...
【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:/n获取包括多个人员的数据记录的数据集,所述数据记录包括已知人员的至少一项行为的数据;/n检测所述数据集中数据记录的属性是否发生变化,所述属性包括数据的类型、单位时间内对应的每种类型的数据的数量;/n如果数据集中数据记录的属性发生变化,则从所述数据集中获取与变化后的属性对应的训练样本集、验证样本集以及测试样本集;/n依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型。/n
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:
获取包括多个人员的数据记录的数据集,所述数据记录包括已知人员的至少一项行为的数据;
检测所述数据集中数据记录的属性是否发生变化,所述属性包括数据的类型、单位时间内对应的每种类型的数据的数量;
如果数据集中数据记录的属性发生变化,则从所述数据集中获取与变化后的属性对应的训练样本集、验证样本集以及测试样本集;
依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取预先配置的模型训练规则,其中,所述模型训练规则包括模型训练采用的算法;
所述依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型的步骤包括:
依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型,并根据预先配置的模型训练规则进行模型训练,获得所述目标模型。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取用户确定的模型训练方法,其中,所述模型训练方法包括线性回归、梯度下降、多项式回归、学习曲线、线性模型正则化、逻辑回归中的至少一种。
4.根据权利要求3所述的方法,其特征在于,所述依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型,并根据预先配置的模型训练规则进行模型训练,获得所述目标模型的步骤包括:
依次将各个训练样本集、验证样本集以及测试样本集输入所述预配置模型,分别采用所述模型训练规则中的算法进行训练,得到每种所述算法对应的子模型;
根据每种所述算法对应的子模型获得目标模型。
5.根据权利要求1-4任一项所述的方法,其特征在于,依次将所述训练样本集、验证样本集以及测试样本集输入预配置模型进行模型训练,获得目标模型前,所述方法还包括:
如果所述数据的数据类型发生变化,则获取每种类型的数据的比例;
根据每种类型的数据的比例获得各个类型的数据的权重系数;
根据所述权重系数调整所述预配置模型中对应...
【专利技术属性】
技术研发人员:徐浩然,陈秀坤,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。