机器学习模型的自动化生成制造技术

技术编号：29419479 阅读：23 留言：0更新日期：2021-07-23 23:13

本公开涉及诸如神经网络的机器学习模型的自动化生成。一个示例系统包括硬件处理单元和存储资源。存储资源可存储计算机可读指令，该可读指令可使硬件处理单元执行包括修改父模型以获取子模型的迭代模型生长过程。迭代模型生长过程也可以包括至少基于在候选层的初始化过程中学习到的权重来选择候选层以包括在子模型中。该系统也可以输出从子模型中选择的最终模型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】机器学习模型的自动化生成
技术介绍
传统上，机器学习模型被由专家手动构建，他们定义模型的结构然后用自动化技术进行模型训练。随着机器学习模型变得越来越复杂，已做出各种尝试来自动化生成机器学习模型的过程。然而，这些努力仅取得有限的成绩。
技术实现思路
提供本“
技术实现思路
”以简化形式介绍了一些构思，这些构思将在下面的“具体实施方式”中进一步描述。本“
技术实现思路
”不旨在标识所要求保护的主题的必要特征，也不旨在用于帮助理解所要求保护的主题的范围。本说明通常涉及用于机器学习模型自动化生成的技术。一个示例包括一种可以在计算设备上被执行的方法或技术。该方法或技术可以包括执行迭代模型生长过程的两次或更多次迭代。迭代模型生长过程可以包括从一个或多个父模型构成的父模型池中选择一个特定父模型，生成多个候选层，并且当重用学习参数和/或特定父模型的结构时初始化多个候选层。迭代模型生长过程也可以包括选择诸如层的特定候选组件，以包括在子模型中用于训练。各个子模型也可以包括特定父模型、以及特定候选层中的一个或多个特定候选层、或其他结构。迭代模型生长过程也可以包括训练多个子模型用以获取经训练的子模型，并使用一个或多个标准来评估经训练的子模型。迭代模型生长过程也可以包括至少基于该评估指定个体经训练的子模型为新的父模型，并且添加新的父模型到父模型池中。该方法或技术也可以包括在两次或更多次迭代后，选择至少一个经训练的子模型作为最终模型，并输出该最终模型。另一示例包括一种系统，该系统包含硬件处理单元和存储资源。存储资源可以存储计算机可读指令，计算机可...

【技术保护点】
1.一种在计算设备上执行的方法，所述方法包括：/n执行迭代模型生长过程的两次或更多次迭代，所述迭代模型生长过程包括：/n从一个或多个父模型构成的父模型池中，选择一个特定父模型；/n生成多个候选层，并且当重用所述特定父模型的学习参数时初始化所述多个候选层；/n选择特定候选层以包括在子模型中用于训练，各个子模型包括所述特定父模型和所述特定候选层中的一个或多个特定候选层；/n训练所述多个子模型以获取经训练的子模型；/n使用一个或多个标准来评估所述经训练的子模型；以及/n至少基于所述评估，指定个体经训练的子模型为新的父模型，并添加所述新的父模型到所述父模型池中；以及/n在所述两次或更多次迭代后，选择至少一个经训练的子模型作为最终模型，并输出所述最终模型。/n

【技术特征摘要】
【国外来华专利技术】20181207 US 16/213,4701.一种在计算设备上执行的方法，所述方法包括：
执行迭代模型生长过程的两次或更多次迭代，所述迭代模型生长过程包括：
从一个或多个父模型构成的父模型池中，选择一个特定父模型；
生成多个候选层，并且当重用所述特定父模型的学习参数时初始化所述多个候选层；
选择特定候选层以包括在子模型中用于训练，各个子模型包括所述特定父模型和所述特定候选层中的一个或多个特定候选层；
训练所述多个子模型以获取经训练的子模型；
使用一个或多个标准来评估所述经训练的子模型；以及
至少基于所述评估，指定个体经训练的子模型为新的父模型，并添加所述新的父模型到所述父模型池中；以及
在所述两次或更多次迭代后，选择至少一个经训练的子模型作为最终模型，并输出所述最终模型。

2.根据权利要求1所述的方法，还包括：
确定训练或测试所述子模型的计算成本；以及
当评估所述经训练的子模型时，使用所述计算成本作为第一标准。

3.根据权利要求2所述的方法，还包括：
确定与所述经训练的子模型相关联的损失；以及
当评估所述经训练的子模型时，使用所述损失作为第二标准。

4.根据权利要求3所述的方法，还包括：
在图上绘制所述子模型，所述图具有反映所述计算成本的第一轴和反映所述损失的第二轴；以及
至少基于所述新的父模型在所述图上的对应位置，选择所述新的父模型。

5.根据权利要求4所述的方法，还包括：
在所述图上确定下凸包或帕累托边界中的至少一个；以及
至少基于所述新的父模型到所述下凸包或所述帕累托边界的接近度，选择所述新的父模型。

6.根据权利要求5所述的方法，其中所述选择包括：
标识在所述下凸包或所述帕累托边界的预定邻近区内的所述经训练的子模型的子集；
确定针对所述经训练的子模型的所述子集的各个概率；以及
至少基于所述各个概率选择所述新的父模型。

7.根据权利要求1所述的方法，其中生成个体候选层包括：
从所述特定父模型选择...

【专利技术属性】
技术研发人员：D·戴，胡含章，R·A·卡鲁阿纳，J·C·兰福德，E·J·霍维茨，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人