【技术实现步骤摘要】
机器学习算法的参数调优方法及系统
本专利技术属于机器学习领域。
技术介绍
现有机器学习算法相关参数调优技术主要包括网格搜索和遗传算法,其中,网格搜索是对每一个参数设定一些候选值,在寻找多个参数的最优组合时,对每一种候选值的组合进行遍历,训练多个模型,取其中表现最优的模型中的参数组合作为结果,例如公开号为CN107844837A的专利技术专利《针对机器学习算法进行算法参数调优的方法及系统》。遗传算法是选取一定数量的候选解,将其抽象为染色体,通过适应度评判选取候选解中的一些较优解,让它们进行自由组合和突变,产生下一代种群,将下一代种群作为新的候选解;不断进行迭代,例如公开号为CN201811038917.5的专利技术专利《一种超参数调优方法、装置及设备》。使用网格搜索进行参数调优,不足之处在于:参数的候选值是人为设定的,做不到完全“自动化”;候选值的选取依靠经验,需要用户具有相关背景知识,并且没有充分利用用户数据集;需要训练众多模型,时间代价大,在参数数目众多时这一缺陷尤为明显。使用遗传算法进行参数调优, ...
【技术保护点】
1.机器学习算法的参数调优方法,其特征在于,所述方法包括:/nS1、输入用户数据集和待调参数算法,提取用户数据集的特征;/nS2、在神经网络数据库中,找到待调参数算法的神经网络,将S1提取的特征输入该神经网络中,该神经网络输出待调参数算法的参数;/n所述神经网络数据库包括根据各种机器学习算法建立及训练好的神经网络,具体构建方法为:/n构建适用于机器学习算法的数据集的知识库;/n提取知识库中每个数据集的特征;/n找到在各数据集上运行各机器学习算法的最优参数;/n建立每个机器学习算法的神经网络,利用数据集的特征和对应的最优参数作为训练集对对应的神经网络进行训练,获得训练好的神经网络。/n
【技术特征摘要】
1.机器学习算法的参数调优方法,其特征在于,所述方法包括:
S1、输入用户数据集和待调参数算法,提取用户数据集的特征;
S2、在神经网络数据库中,找到待调参数算法的神经网络,将S1提取的特征输入该神经网络中,该神经网络输出待调参数算法的参数;
所述神经网络数据库包括根据各种机器学习算法建立及训练好的神经网络,具体构建方法为:
构建适用于机器学习算法的数据集的知识库;
提取知识库中每个数据集的特征;
找到在各数据集上运行各机器学习算法的最优参数;
建立每个机器学习算法的神经网络,利用数据集的特征和对应的最优参数作为训练集对对应的神经网络进行训练,获得训练好的神经网络。
2.根据权利要求1所述的机器学习算法的参数调优方法,其特征在于,所述方法还包括:
S3、使用局部优化器找到S2输出参数的局部极值,作为机器学习算法的进一步优化参数。
3.根据权利要求1所述的机器学习算法的参数调优方法,其特征在于,构建神经网络数据库时,利用网格搜索的方法找到在各数据集上运行各机器学习算法的最优参数。
4.机器学习算法的参数调优系统...
【专利技术属性】
技术研发人员:王宏志,欧龙燊,张恺欣,霸晨民,陈泊舟,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:黑龙;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。