当前位置: 首页 > 专利查询>清华大学专利>正文

一种用于神经网络架构空间的可视分析系统和方法技术方案

技术编号:35265671 阅读:14 留言:0更新日期:2022-10-19 10:27
本发明专利技术公开了一种用于神经网络架构空间的可视分析系统和方法。该方法包括:接收至少一个神经网络架构;获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离;根据所述图编辑距离,获得所述神经网络架构的聚类层次化结构,其中,所述聚类层次化结构的每一层包括至少一个神经网络架构类别,每个类别包括神经网络架构;以及对所述神经网络架构的聚类层次化结构中的至少一层进行可视化,其中可视化视图提供所述神经网络架构的全局概览和其中任意一个神经网络架构的上下文信息。中任意一个神经网络架构的上下文信息。中任意一个神经网络架构的上下文信息。

【技术实现步骤摘要】
一种用于神经网络架构空间的可视分析系统和方法


[0001]本专利技术涉及数据的可视化,特别地,本专利技术涉及一种用于神经网络架构空间的可视分析系统和方法。

技术介绍

[0002]人工智能的最新进展很大程度上得益于更好的神经网络架构设计,这些架构的成功设计依赖于代价高昂的试错过程。
[0003]随着大型计算集群的发展,神经网络架构搜索被提出以自动化神经网络架构设计的过程。神经网络架构搜索通过训练和评估大量候选架构,自动在神经网络架构空间中选择性能良好的架构。然而,由于神经网络架构搜索方法找到的性能良好的神经网络架构取决于对特定数据集的评估,因此,搜索到的神经网络架构在其他数据集上的性能可能不佳。获得神经网络架构中的具体结构组件对神经网络性能的影响有利于神经网络架构设计人员设计或者神经网络架构搜索工具在搜索空间中搜索出在多种数据集上性能都较好的神经网络架构,并减少神经网络架构搜索工具的搜索空间和计算成本。还由于神经网络架构空间中神经网络架构数量庞大,关系复杂,因此急需一种技术方案和工具对网络架构进行深度层次化分析。

技术实现思路

[0004]根据本专利技术的一个方面,提出了一种用于神经网络架构空间的可视分析系统,包括:接收模块,用于接收至少一个神经网络架构;神经网络架构距离计算模块,用于获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离;层次化结构生成模块,用于根据所述图编辑距离,获得所述多个神经网络架构的聚类层次化结构,其中,所述聚类层次化结构的每一层包括至少一个神经网络架构类别,每个类别包括多个神经网络架构;以及可视化模块,用于对所述神经网络架构的聚类层次化结构中的至少一层进行可视化,其中可视化视图提供所述接收模块中神经网络架构的全局概览和其中任意一个神经网络架构的上下文信息。
[0005]根据本专利技术的另一个方面,提出了一种用于神经网络架构空间的可视分析方法,该方法包括:接收至少一个神经网络架构;获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离;根据所述图编辑距离,获得所述神经网络架构的聚类层次化结构,其中,所述聚类层次化结构的每一层包括至少一个神经网络架构类别,每个类别包括神经网络架构;以及对所述神经网络架构的聚类层次化结构中的至少一层进行可视化,其中可视化视图提供所述神经网络架构的全局概览和其中任意一个神经网络架构的上下文信息。
[0006]根据本专利技术的又一方面,提出了一种用于分析神经网络架构空间的计算机可读存储介质,所述计算机可读存储介质具有存储其中的程序指令,所述程序指令可由计算设备执行以使得计算设备执行如上所述的方法。
附图说明
[0007]通过参照附图阅读下面对说明性实施例的详细说明可更好地理解专利技术本身以及其优选使用模式、目标、特征以及优点,在附图中:
[0008]图1示出了根据本专利技术的实施例的一种用于神经网络架构空间的可视分析系统的结构框图;
[0009]图2示出了根据本专利技术的实施例的神经网络架构距离计算模块将4个神经网络架构表示为有向无环图以及计算它们之间对应的图编辑距离的示例;
[0010]图3示出了根据本专利技术的实施例的神经网络架构距离计算模块计算5个神经网络架构中任意两个神经网络架构之间的图编辑距离的过程示例;
[0011]图4示出了根据本专利技术的实施例的层次化结构生成模块构建神经网络架构的聚类层次化结构方法的流程图;
[0012]图5示出了根据本专利技术的实施例的可视化模块计算每个采样神经网络架构的布局位置的方法的流程图;
[0013]图6示出了根据本专利技术的实施例的调整采样的神经网络架构中的每个神经网络架构与六边形网格的每个网格点之间的对应关系的方法的流程图;
[0014]图7示出了一个基于本专利技术的方法开发的ArchExplorer系统中对神经网络架构的聚类层次化结构中的一层进行可视化的界面。
具体实施方式
[0015]下面参照附图来说明本专利技术的实施例。在下面的说明中,阐述了许多具体细节以便更全面地了解本专利技术。但是,对于本
内的技术人员明显的是,本专利技术的实现可不具有这些具体细节中的一些。此外,应当理解的是,本专利技术并不限于所介绍的特定实施例。相反,可以考虑用下面的特征和要素的任意组合来实施本专利技术,而无论它们是否涉及不同的实施例。因此,下面的方面、特征、实施例和优点仅作说明之用而不应被看作是所附权利要求的要素或限定,除非权利要求中明确提出。
[0016]近年来,人工智能在图像识别、语音识别和机器翻译等各种任务上取得了显著进展。人工智能的最新进展很大程度上得益于更好的神经网络架构设计。一个设计得具有好的架构的神经网络模型可以充分释放数据的潜能,从而更好地完成上述各种任务。然而神经网络架构设计需要专家知识和代价高昂的试错过程,神经网络架构搜索技术的发展自动化了这一过程,但是在实际应用中仍然具有搜索成本高、搜索出的架构应用范围窄等不足之处。
[0017]现有的可视分析技术没有触及对神经网络架构空间的可视化分析。本专利技术提出了一种用于神经网络架构空间的可视分析系统和方法,该方法包括建模并计算神经网络架构空间中的任意两个神经网络架构之间的结构相似性,建立神经网络架构空间中神经网络架构的聚类层次化结构,通过一个保留神经网络架构类别之间的相似度和局部相似上下文信息的可视化展示神经网络架构的聚类层次化结构,同时提供交互帮助用户发现和比较神经网络架构空间中感兴趣的神经网络架构。本专利技术的方法能够帮助用户可视地分析神经网络架构空间中神经网络架构之间的结构相似性和性能之间的关系,因此能够通过交互帮助用户获得神经网络架构中的具体结构组件对神经网络性能的影响,有利于神经网络架构设计
人员设计或者神经网络架构搜索工具在搜索空间中搜索出在多种数据集上性能都较好的神经网络架构,并减少神经网络架构搜索工具的搜索空间和计算成本。
[0018]在本专利技术的下述描述中,每个神经网络架构由输入层、输出层、和若干中间层(如卷积层和池化层)组成。除了输入层之外,每一层可以接收来自至少一个其他层的输入;除了输出层之外,每一层的输出至少为一个其他层的输入。
[0019]图1示出了根据本专利技术的一个或实施例的一种用于神经网络架构空间的可视分析系统100的结构框图。
[0020]如图1所示,可视分析系统100包括接收模块110,神经网络架构距离计算模块120,层次化结构生成模块130,和可视化模块140。其中接收模块110被配置为接收至少一个神经网络架构101。
[0021]神经网络架构距离计算模块120被配置为获得神经网络架构101中任意两个神经网络架构之间的图编辑距离102。图编辑距离102定义将在图2中详细描述。
[0022]层次化结构生成模块130被配置为根据计算的该神经网络架构中任意两个神经网络架构之间的图编辑距离102,获得该神经网络架构的聚类层次化结构103。该聚类层次化结构的每一层包括至少一个神经网络架构类别,其中每个类别包括神经网络架构。聚类层次化结构104将在后面详细描述。...

【技术保护点】

【技术特征摘要】
1.一种用于神经网络架构空间的可视分析系统,其特征在于,所述系统包括:接收模块,用于接收至少一个神经网络架构;神经网络架构距离计算模块,用于获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离;层次化结构生成模块,用于根据所述图编辑距离,获得所述神经网络架构的聚类层次化结构,其中,所述聚类层次化结构的每一层包括至少一个神经网络架构类别,每个类别包括神经网络架构;以及可视化模块,用于对所述神经网络架构的聚类层次化结构中的至少一层进行可视化,其中可视化视图提供所述接收模块中神经网络架构的全局概览和其中任意一个神经网络架构的上下文信息。2.根据权利要求1所述的系统,其特征在于,所述可视化模块,具体用于:接收选择的所述层次化结构生成模块对所述神经网络架构的聚类层次化结构中一层;对所述选择的一层中包括的神经网络架构进行采样;将每个采样的神经网络架构布局在二维平面上;以及计算每个采样的神经网络架构在所述二维平面上的布局位置,所述布局位置保留所述选择的一层中的神经网络架构类别的全局类别距离关系和采样的神经网络架构的局部邻居关系。3.根据权利要求2所述的系统,其特征在于,所述可视化模块,还用于:对所述选择的一层中包括的神经网络架构类别,利用所述神经网络架构距离计算模块计算任意两个神经网络架构类别之间的类别距离;根据计算的所述任意两个神经网络架构类别之间的类别距离,计算所述每个神经网络架构类别的类别中心的第一布局位置;对所述选择的一层中包括的神经网络架构类别,计算每个神经网络架构类别中采样的神经网络架构的第二布局位置;对所述选择的一层中包括的每个神经网络架构类别中选择m个采样的代表性神经网络架构,其中,m为大于1的正整数;对所述每个神经网络架构类别中的m个采样的代表性神经网络架构生成结构图;计算所述结构图的第三布局位置;以及根据所述第一、第二和第三布局位置,在所述二维平面中对所述选择的一层中至少一个神经网络架构和对应的结构图进行可视化展示。4.根据权利要求3所述的系统,其特征在于,所述可视化模块,还用于对所述选择的一层中包括的神经网络架构类别中的每个特定的神经网络架构类别执行下述操作,具体为:以所述第一布局位置为中心,生成一个六边形网格,所述六边形网格中至少包括网格点;根据所述特定的神经网络架构类别中的采样的神经网络架构的任意两个神经网络架构的图编辑距离,调整所述采样的神经网络架构中的每个神经网络架构与所述六边形网格的每个网格点之间的对应关系,使得网格点对应的神经网络架构之间的图编辑距离之和满足预设条件;以及获得所述采样的神经网络架构的每个神经网络架构对应的网格点在所述二维平面上
的位置作为其第二布局位置。5.根据权利要求4所述的系统,其特征在于,所述预设条件包括:所述六边形网格中的相邻网格点对应的神经网络架构之间的图编辑距离之和尽可能小。6.根据权利要求4或5所述的系统,其特征在于,所述可视化模块,还用于:根据所述六边形网格中每个网格点到六边形网格中心的距离,对每个网格点进行排序;对所述排序后的每个网格点,按照所述排序依次计算该网格点对应的神经网络架构,使得其与相邻网格点对应的神经网络架构的图编辑距离之和最小;确定是否存在满足第一条件的一对网格点,所述第一条件包括交换所述一对网格点对应的神经网络架构可以减少相邻网格点对应的神经网络架构之间的图编辑距离之和;响应于存在满足所述第一条件的一对网格点,交换所述网格点对所对应的神经网络架构,并返回确定步骤;以及响应于不存在满足所述第一条件的一对网格点,停止执行对网格点对应的神经网络架构的调整。7.根据权利要求1所述的系统,其特征在于,所述神经网络架构距离计算模块,具体用于:将所述神经网络架构的每个神经网络架构表示为有向无环图,所述有向无环图的结点表示所述神经网络架构中的层,所述有向无环图的边表示所述神经网络架构中层与层之间的连接关系;对所述神经网络架构中每个神经网络架构表示的有向无环图进行编辑操作;获得每个神经网络架构的所述编辑操作后得到的对应的神经网络架构,所述对应的神经网络架构属于所述接收模块中神经网络架构;建立所述神经网络架构的邻居图,其中所述邻居图中的结点表示所述神经网络架构,所述邻居图中的边用于连接所述通过编辑操作可变换得到的两个对应的神经网络架构,所述边的权重表示所述编辑操作的成本;以及计算所述邻居图中所有结点中任意两个结点之间的最短路径长度,所述最短路径长度为所述神经网络架构中任意两个神经网络架构之间的图编辑距离。8.一种用于神经网络架构空间的可视分析方法,其特征在于,包括:接收至少一个神经网络架构;获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离;根据所述图编辑距离,获得所述神经网络架构的聚类层次化结构,其中,所述聚类层次化结构的每一层包括至少一个神经网络架构类别,每个类别包括神经网络架构;以及对所述神经网络架构的聚类层次化结构中的至少一层...

【专利技术属性】
技术研发人员:刘世霞袁隽田丰源
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1