一种用于神经网络架构空间的可视分析系统和方法技术方案

技术编号：35265671 阅读：14 留言：0更新日期：2022-10-19 10:27

本发明专利技术公开了一种用于神经网络架构空间的可视分析系统和方法。该方法包括：接收至少一个神经网络架构；获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离；根据所述图编辑距离，获得所述神经网络架构的聚类层次化结构，其中，所述聚类层次化结构的每一层包括至少一个神经网络架构类别，每个类别包括神经网络架构；以及对所述神经网络架构的聚类层次化结构中的至少一层进行可视化，其中可视化视图提供所述神经网络架构的全局概览和其中任意一个神经网络架构的上下文信息。中任意一个神经网络架构的上下文信息。中任意一个神经网络架构的上下文信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于神经网络架构空间的可视分析系统和方法

[0001]本专利技术涉及数据的可视化，特别地，本专利技术涉及一种用于神经网络架构空间的可视分析系统和方法。

技术介绍

[0002]人工智能的最新进展很大程度上得益于更好的神经网络架构设计，这些架构的成功设计依赖于代价高昂的试错过程。
[0003]随着大型计算集群的发展，神经网络架构搜索被提出以自动化神经网络架构设计的过程。神经网络架构搜索通过训练和评估大量候选架构，自动在神经网络架构空间中选择性能良好的架构。然而，由于神经网络架构搜索方法找到的性能良好的神经网络架构取决于对特定数据集的评估，因此，搜索到的神经网络架构在其他数据集上的性能可能不佳。获得神经网络架构中的具体结构组件对神经网络性能的影响有利于神经网络架构设计人员设计或者神经网络架构搜索工具在搜索空间中搜索出在多种数据集上性能都较好的神经网络架构，并减少神经网络架构搜索工具的搜索空间和计算成本。还由于神经网络架构空间中神经网络架构数量庞大，关系复杂，因此急需一种技术方案和工具对网络架构进行深度层次化分析。

技术实现思路

[0004]根据本专利技术的一个方面，提出了一种用于神经网络架构空间的可视分析系统，包括：接收模块，用于接收至少一个神经网络架构；神经网络架构距离计算模块，用于获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离；层次化结构生成模块，用于根据所述图编辑距离，获得所述多个神经网络架构的聚类层次化结构，其中，所述聚类层次化结构的每一层包括至少一个神经网络架构类别，每个类

【技术保护点】

【技术特征摘要】
1.一种用于神经网络架构空间的可视分析系统，其特征在于，所述系统包括：接收模块，用于接收至少一个神经网络架构；神经网络架构距离计算模块，用于获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离；层次化结构生成模块，用于根据所述图编辑距离，获得所述神经网络架构的聚类层次化结构，其中，所述聚类层次化结构的每一层包括至少一个神经网络架构类别，每个类别包括神经网络架构；以及可视化模块，用于对所述神经网络架构的聚类层次化结构中的至少一层进行可视化，其中可视化视图提供所述接收模块中神经网络架构的全局概览和其中任意一个神经网络架构的上下文信息。2.根据权利要求1所述的系统，其特征在于，所述可视化模块，具体用于：接收选择的所述层次化结构生成模块对所述神经网络架构的聚类层次化结构中一层；对所述选择的一层中包括的神经网络架构进行采样；将每个采样的神经网络架构布局在二维平面上；以及计算每个采样的神经网络架构在所述二维平面上的布局位置，所述布局位置保留所述选择的一层中的神经网络架构类别的全局类别距离关系和采样的神经网络架构的局部邻居关系。3.根据权利要求2所述的系统，其特征在于，所述可视化模块，还用于：对所述选择的一层中包括的神经网络架构类别，利用所述神经网络架构距离计算模块计算任意两个神经网络架构类别之间的类别距离；根据计算的所述任意两个神经网络架构类别之间的类别距离，计算所述每个神经网络架构类别的类别中心的第一布局位置；对所述选择的一层中包括的神经网络架构类别，计算每个神经网络架构类别中采样的神经网络架构的第二布局位置；对所述选择的一层中包括的每个神经网络架构类别中选择m个采样的代表性神经网络架构，其中，m为大于1的正整数；对所述每个神经网络架构类别中的m个采样的代表性神经网络架构生成结构图；计算所述结构图的第三布局位置；以及根据所述第一、第二和第三布局位置，在所述二维平面中对所述选择的一层中至少一个神经网络架构和对应的结构图进行可视化展示。4.根据权利要求3所述的系统，其特征在于，所述可视化模块，还用于对所述选择的一层中包括的神经网络架构类别中的每个特定的神经网络架构类别执行下述操作，具体为：以所述第一布局位置为中心，生成一个六边形网格，所述六边形网格中至少包括网格点；根据所述特定的神经网络架构类别中的采样的神经网络架构的任意两个神经网络架构的图编辑距离，调整所述采样的神经网络架构中的每个神经网络架构与所述六边形网格的每个网格点之间的对应关系，使得网格点对应的神经网络架构之间的图编辑距离之和满足预设条件；以及获得所述采样的神经网络架构的每个神经网络架构对应的网格点在所述二维平面上
的位置作为其第二布局位置。5.根据权利要求4所述的系统，其特征在于，所述预设条件包括：所述六边形网格中的相邻网格点对应的神经网络架构之间的图编辑距离之和尽可能小。6.根据权利要求4或5所述的系统，其特征在于，所述可视化模块，还用于：根据所述六边形网格中每个网格点到六边形网格中心的距离，对每个网格点进行排序；对所述排序后的每个网格点，按照所述排序依次计算该网格点对应的神经网络架构，使得其与相邻网格点对应的神经网络架构的图编辑距离之和最小；确定是否存在满足第一条件的一对网格点，所述第一条件包括交换所述一对网格点对应的神经网络架构可以减少相邻网格点对应的神经网络架构之间的图编辑距离之和；响应于存在满足所述第一条件的一对网格点，交换所述网格点对所对应的神经网络架构，并返回确定步骤；以及响应于不存在满足所述第一条件的一对网格点，停止执行对网格点对应的神经网络架构的调整。7.根据权利要求1所述的系统，其特征在于，所述神经网络架构距离计算模块，具体用于：将所述神经网络架构的每个神经网络架构表示为有向无环图，所述有向无环图的结点表示所述神经网络架构中的层，所述有向无环图的边表示所述神经网络架构中层与层之间的连接关系；对所述神经网络架构中每个神经网络架构表示的有向无环图进行编辑操作；获得每个神经网络架构的所述编辑操作后得到的对应的神经网络架构，所述对应的神经网络架构属于所述接收模块中神经网络架构；建立所述神经网络架构的邻居图，其中所述邻居图中的结点表示所述神经网络架构，所述邻居图中的边用于连接所述通过编辑操作可变换得到的两个对应的神经网络架构，所述边的权重表示所述编辑操作的成本；以及计算所述邻居图中所有结点中任意两个结点之间的最短路径长度，所述最短路径长度为所述神经网络架构中任意两个神经网络架构之间的图编辑距离。8.一种用于神经网络架构空间的可视分析方法，其特征在于，包括：接收至少一个神经网络架构；获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离；根据所述图编辑距离，获得所述神经网络架构的聚类层次化结构，其中，所述聚类层次化结构的每一层包括至少一个神经网络架构类别，每个类别包括神经网络架构；以及对所述神经网络架构的聚类层次化结构中的至少一层...

【专利技术属性】
技术研发人员：刘世霞，袁隽，田丰源，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人