使用元学习优化机器学习流水线的自动选择制造技术

技术编号:37702117 阅读:20 留言:0更新日期:2023-06-01 23:48
计算机使用元学习机器学习模型来自动选择机器学习模型流水线。计算机接收基础事实数据和流水线偏好元数据。计算机确定适合于基础事实数据的一组流水线,并且每个流水线包括算法。流水线可包括数据预处理例程。计算机为流水线生成超参数集合。计算机将预处理例程应用于基础事实数据,以生成基础事实数据的一组预处理的集合,并对每个流水线的超参数集合性能进行排序,以针对每个流水线建立优选的超参数集合。计算机选择偏好的数据特征并将每个流水线以及相关联的优选的超参数集合用于对预处理的基础事实数据的偏好的数据特征进行评分。计算机对流水线性能进行排序,并根据排序选择候选流水线。候选流水线。候选流水线。

【技术实现步骤摘要】
【国外来华专利技术】使用元学习优化机器学习流水线的自动选择

技术介绍

[0001]本专利技术总体上涉及信息可视化、人工智能、自动机器学习、数据科学的领域,并且更具体地涉及优化机器学习流水线的选择的预测系统。
[0002]机器学习系统识别所存储的数据中的模式以形成能够预测类似数据的评分结果的计算机化模型。自动机器学习(Automatic Machine Learning,“自动ML”)涉及流线化(streamlining)机器学习过程的各个方面。
[0003]自动ML例程使构建和操作AI模型中涉及的通常人员密集的以及其他高度熟练的端到端任务自动化。不同于容易应用于同类训练数据的典型机器学习应用,在数据格式和内容在很大程度上不同的情况下使用自动ML应用。为了适应这种不同的输入数据,自动ML系统解决机器学习过程的各个方面,包括数据准备、数据特征工程(data feature engineering)、算法的选择和超参数(hyperparameter)选择。

技术实现思路

[0004]根据一个实施例,一种使用元学习机器学习模型来自动选择机器学习模型流水线的计算机实现本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种使用元学习机器学习模型自动选择机器学习模型流水线的计算机实现的方法,所述方法包括:由所述计算机接收基础事实数据和流水线偏好元数据;由所述计算机确定适合于所述基础事实数据的多个流水线,其中所述多个流水线中的每个流水线包括算法,并且所述流水线中的至少一个流水线包括相关联的数据预处理例程;由所述计算机为所述多个流水线中的每个流水线生成目标数量的超参数集合;由所述计算机将所述预处理例程应用于所述基础事实数据以生成所述基础事实数据的多个预处理的集合;由所述计算机对所述流水线中的每个流水线的所述超参数集合中的每个超参数集合的超参数性能进行排序,以建立所述多个流水线中的每个流水线的优选的超参数集合;由所述计算机采用句嵌入算法选择偏好的数据特征;由所述计算机应用每个所述流水线以及所述优选的超参数集合来对所述基础事实数据的多个预处理的集合中的适当预处理的集合的偏好的数据特征进行评分,并根据其对流水线性能进行排序;以及由所述计算机至少部分地根据流水线性能排序来选择候选流水线。2.根据权利要求1所述的方法,其中,所述流水线性能的排序至少部分地基于由用户提供的流水线属性。3.根据权利要求1所述的方法,还包括将多个流水线组装成协作的集成。4.根据权利要求3所述的方法,其中,流水线评分协议的出现被突出显示。5.根据权利要求3所述的方法,其中,所述集成被呈现给用户以供反馈,并且根据所述反馈所述集成中的流水线被选择性地从所述集成移除。6.根据权利要求1所述的方法,其中,所述偏好的数据特征是至少部分地考虑数据处理时间来选择的。7.根据权利要求1所述的方法,还包括由所述计算机从用户接收关于所述数据特征的域知识,并且将所述域知识作为特征工程的形式应用。8.根据权利要求1所述的方法,其中,所述流水线性能的排序至少部分地基于数据评分准确度。9.根据权利要求1所述的方法,其中,所述超参数集合是至少部分地根据为与所述超参数相关联的算法提供最佳性能的统计可能性来选择的。10.一种使用元学习机器学习模型来自动选择机器学习模型流水线的系统,所述系统包括:计算机系统,包括具有程序指令的计算机可读存储介质,所述程序指令可由计算机执行以使所述计算机:接收基础事实数据和流水线偏好元数据;确定适合于所述基础事实数据的多个流水线,其中所述多个流水线中的每个流水线包括算法,并且所述流水线中的至少一个流水线包括相关联的数据预处理例程;为所述多个流水线中的每个流水线生成目标数量的超参数集合;将所述预处理例程应用于所述基础事实数据以生成所述基础事实数据的多个预处理
的集合;对所述流水线中的每个流水线的所述超参数集合中的每个超参数集合的超参数性能进行排名,以建立所述多个流水线中的每个流水线的优选的超参数集合;应用句嵌入算法来...

【专利技术属性】
技术研发人员:王大阔淦创G
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1