【技术实现步骤摘要】
用于生成信息的方法和装置
本公开实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
在机器学习领域,由于使用机器学习算法进行建模的门槛较高,且人工调整模型参数的时间成本较高,因此自动化建模逐渐成为了热点。自动化建模使用简单,一方面可以使得一些对机器学习方面基础比较薄弱的人员快速入手使用。另一方面可以大幅度节省人工调整模型流程和参数的时间。目标自动化建模仍处于发展阶段,大量的研究都处于摸索阶段。
技术实现思路
本公开实施例提出了用于生成信息的方法和装置。第一方面,本公开实施例提供了一种用于生成信息的方法,该方法包括:接收建模请求,其中,上述建模请求包括训练用数据、模型类别、目标数量和评估指标;根据上述训练用数据的类型和上述模型类别,确定上述目标数量个初始机器学习管道,其中,初始机器学习管道用于进行模型训练;使用上述目标数量个初始机器学习管道执行以下模型生成步骤:基于上述目标数量个初始机器学习管道,生成上述目标数量个新机器学习管道;基于上述训练用数据、上述目标数量个初始机器学习管道以及上述目标数量个新机器学习管道进行模型训练,生成训练后模型;根据上述评 ...
【技术保护点】
1.一种用于生成信息的方法,包括:接收建模请求,其中,所述建模请求包括训练用数据、模型类别、目标数量和评估指标;根据所述训练用数据的类型和所述模型类别,确定所述目标数量个初始机器学习管道,其中,初始机器学习管道用于进行模型训练;使用所述目标数量个初始机器学习管道执行以下模型生成步骤:基于所述目标数量个初始机器学习管道,生成所述目标数量个新机器学习管道;基于所述训练用数据、所述目标数量个初始机器学习管道以及所述目标数量个新机器学习管道进行模型训练,生成训练后模型;根据所述评估指标,分别对得到的训练后模型进行评估;确定是否达到预设的训练终止条件;响应于确定达到预设的训练终止条件 ...
【技术特征摘要】
1.一种用于生成信息的方法,包括:接收建模请求,其中,所述建模请求包括训练用数据、模型类别、目标数量和评估指标;根据所述训练用数据的类型和所述模型类别,确定所述目标数量个初始机器学习管道,其中,初始机器学习管道用于进行模型训练;使用所述目标数量个初始机器学习管道执行以下模型生成步骤:基于所述目标数量个初始机器学习管道,生成所述目标数量个新机器学习管道;基于所述训练用数据、所述目标数量个初始机器学习管道以及所述目标数量个新机器学习管道进行模型训练,生成训练后模型;根据所述评估指标,分别对得到的训练后模型进行评估;确定是否达到预设的训练终止条件;响应于确定达到预设的训练终止条件,根据评估结果,从得到的训练后模型中确定目标训练后模型。2.根据权利要求1所述的方法,其中,所述方法还包括:响应于确定未达到预设的训练终止条件,根据评估结果,从所述目标数量个初始机器学习管道和所述目标数量个新机器学习管道中选取所述目标数量个机器学习管道作为初始机器学习管道,继续执行所述模型生成步骤。3.根据权利要求1所述的方法,其中,所述方法还包括:生成针对所述目标训练后模型的模型文件,以及对所述目标训练后模型进行评估;将所述模型文件以及所述目标训练后模型的评估结果进行推送。4.根据权利要求1所述的方法,其中,所述建模请求还包括最大迭代次数,以及所述训练终止条件包括:执行所述模型生成步骤的次数达到所述最大迭代次数;响应于确定执行所述模型生成步骤的次数未达到所述最大迭代次数,以及连续执行所述模型生成步骤预设次数得到的最优训练后模型的评估结果不变。5.根据权利要求1所述的方法,其中,所述基于所述目标数量个初始机器学习管道,生成所述目标数量个新机器学习管道,包括:根据预设的交换比例,从所述目标数量个初始机器学习管道选取初始机器学习管道组成初始机器学习管道子集,基于所述初始机器学习管道子集中的两两初始机器学习管道,执行以下数据交换步骤:确定所选取的两个初始机器学习管道对应的两个模型是否相同;响应于确定相同,交换两个模型的模型参数,得到两个新机器学习管道;响应于确定不相同,交换所选取的两个初始机器学习管道对应的模型,得到两个新机器学习管道;对于所述目标数量个初始机器学习管道中的、除所述初始机器学习管道子集所包括的初始机器学习管道之外的初始机器学习管道,基于该初始机器学习管道生成新机器学习管道。6.根据权利要求1所述的方法,其中,所述基于所述目标数量个初始机器学习管道,生成所述目标数量个新机器学习管道,包括:从所述目标数量个初始机器学习管道选取两个初始机器学习管道,执行以下数据交换步骤:确定所选取的两个初始机器学习管道对应的两个模型是否相同;响应于相同,交换两个模型的模型参数,得到两个新机器学习管道;响应于确定不相同,交换所选取的两个初始机器学习管道对应的模型,得到两个新机器学习管道;从所述目标数量个初始机器学习管道中选取出未执行过所述数据交换步骤的两个初始机器学习管道,继续执行所述数据交换步骤。7.根据权利要求1所述的方法,其中,初始机器学习管道包括至少一个数据处理阶段和一个模型训练阶段;以及所述基于所述目标数量个初始机器学习管道,生成所述目标数量个新机器学习管道,包括:对于所述目标数量个初始机器学习管道中的机器学习管道,选取该初始机器学习管道的至少一个数据处理阶段和/或模型训练阶段对应的模型中的预设数量个部分进行变化,生成新机器学习管道。8.一种用于生成信息的装置,包括:接收单元,被配置成接收建模请求,其中,所述建模请求包括训练用数据、模型类别、目标数量和评估指标;确定单元,被配置成根据所述训练用数据的类型和所述模型类别,确定所述目标数...
【专利技术属性】
技术研发人员:韩光耀,陈兴波,谢国斌,刘彦江,曲福,薛礼强,张瑾,秦文静,罗小兰,杜泓江,姜泽青,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。