用于创建机器学习系统的方法和设备技术方案

技术编号：36653634 阅读：14 留言：0更新日期：2023-02-18 13:17

用于创建机器学习系统的方法和设备，所述方法包括以下步骤：提供具有输入节点和输出节点的有向图，其中向每条边分配概率，该概率表征以什么样的概率绘制边。在随机绘制架构之前，根据对有向图架构的探索程度来操纵所述概率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
用于创建机器学习系统的方法和设备

[0001]本专利技术涉及一种使用描述机器学习系统的多个可能架构的图来创建机器学习系统的方法、计算机程序和机器可读存储介质。

技术介绍

[0002]架构搜索的目标，特别是神经网络的架构搜索的目标是完全自动地在预给定数据集的性能指标/度量的意义上找到尽可能好的网络架构。
[0003]为了使自动架构搜索在计算上高效，搜索空间中的不同架构可以共享其运算的权重，例如在one
‑
shot NAS模型中，由Pham, H.、Guan, M.Y.、Zoph, B.、Le, Q.V.和Dean, J.(2018)：Efficient neural architecture search via parameter sharing（通过参数共享进行高效的神经架构搜索），arXiv预印本arXiv:1802.03268展示的。
[0004]在此，一次性（one
‑
shot）模型典型地构建为有向图，其中节点表示数据，边表示运算，这些运算表示将输入节点的数据转换为输出节点的数据的计算规则。搜索空间在此由一次性模型中的子图（例如路径）组成。由于一次性模型可能非常大，因此可以从一次性模型中提取各个架构以用于训练，例如由Cai, H.、Zhu, L.和Han, S.(2018)在ProxylessNAS：Direct neural architecture search on target task and hardware（针对目标任务和硬件的直接神经架构搜索...

【技术保护点】

【技术特征摘要】
1.一种用于创建机器学习系统的计算机实现的方法（20），所述方法包括以下步骤：提供（S21）具有通过多个边和节点连接的一个或多个输入节点和输出节点的有向图，其中向每个边分配变量(α)，所述变量表征了以什么样的概率绘制相应边；通过所述有向图根据所述变量（α）随机绘制（S22）多个子图，其中根据所述图中所述变量（α）的值的分布来改变所述变量（α）；教导（S23）与绘制的子图相对应的机器学习系统，其中在教导过程中适配所述机器学习系统的参数和所述变量(α)，使得成本函数得到优化；以及根据经过适配的概率绘制（S24）子图，并且创建与该子图对应的机器学习系统。2.根据权利要求1所述的方法，其中当所述变量(α)的值的分布的度量相对于目标分布的预给定目标度量更大时，改变所述变量(α)，使得以基本相等的概率来绘制边的分布。3.根据权利要求1或2中任一项所述的方法，其中根据所述有向图的熵并且特别是根据已经执行的教导步骤的数量来改变所述变量(α)。4.根据权利要求3所述的方法，其中当所述熵(S
new
)大于预给定的目标熵(S
target
)时按照以下方式改变用于改变所述变量(α)的参数(T,
ϵ
)，即改变所述变量(α)的...

【专利技术属性】
技术研发人员：B，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人