基于差异比较的卷积神经网络可视分析方法技术

技术编号:20364547 阅读:21 留言:0更新日期:2019-02-16 17:16
一种基于差异比较的卷积神经网络可视分析方法,包括以下步骤:使用Tensorflow设计需要基本网络模型,并在此基础上做参数的修改得出对照模型;对两个模型进行训练,并提取训练完成后的模型参数;将得到的模型参数输入差异分析系统进行差异展示;通过观察差异分析系统的差异概览组件快速找到可能的关键差异点;通过系统提供的交互探索组件对可能的关键差异进行进一步的详细分析,从而得出自己的结论。本发明专利技术有效实现差异化可视分析,通过对这些差异的理解用户可以在实际对神经网络模型进行修改的过程中更加有效率地找到关键问题所在。

【技术实现步骤摘要】
基于差异比较的卷积神经网络可视分析方法
本专利技术涉及一种卷积神经网络可视分析方法。
技术介绍
深度卷积神经网络在例如自动驾驶、癌症检测、语句分析等模式识别领域有着广泛的应用.鉴于其良好的性能,越来越多的企业和研究者基于各种需求要对它进行应用发掘和特性研究.然而由于现阶段对于卷积神经网络模型运行机理的解释尚不完善。多数时候我们还是将其当成一个“黑箱”来处理,这会导致当模型输出结果不符合预期时,我们难以对模型进行问题定位和性能优化。理解卷积神经网络模型主要有两大难点,其一是模型内部数量庞大的参数,卷积层可能包含成百上千的卷积核,卷积核内部有包含数量与其尺寸相对应的权重参数,全连接层与上一层输出之间包含大量连接权重参数。包含如此多的参数使得模型分析难以下手。其二是模型包含大量的非线性计算单元,包括激活函数,卷积核,池化层等,这些非线性计算单元的存在使得卷积神经网络的运算过程难以理解。虽然解释深度神经网络存在诸多困难,但鉴于其实用价值,对深度神经网络的解释和理解仍然是现阶段人工智能研究的热点之一,近几年来已经有许多研究人员在这方面做了不少的工作.这些工作大致可以分成两类,其中一类是以理论推理解释为主,辅助以简单的可视展示以对结论进行验证的理论解释性工作。另一类则是以交互式可视展现和分析为主,其通过对神经网络的组件或运行过程进行数据处理和可视展现,并辅助以一定的交互探索功能,让研究者可以自由地探索和分析神经网络中的内在机制和模式,针对不同现象得出合理的解释。虽然很多工作对神经网络中存在的特征提取、模式聚类等问题展开了分析,并针对各式神经网络如卷积神经网络、循环神经网络等展开了分析,然而针对影响神经网络性能的敏感性因素如网络模型结构、输入数据特征及其相关性、激活函数设置和网络参数等发生改变之后的差异化可视分析,现在仍旧没有非常有效的解决方案。
技术实现思路
现有的神经网络可视化方法关注的重点更多的是对网络原理的解释,并不能很好的对神经网络的差异进行可视分析,故本专利技术提出一种基于差异分析的卷积神经网络可视化方法,对卷积神经网络进行参数敏感性分析以此判断具有展示价值的参数,再对两个卷积神经网络模型进行控制变量实验,通过如图1所示的差异分析系统将两者各个层面的差异进行整合而后通过可视化的方式展示出来,并且提供相应的交互探索方式让用户可以对差异进行更加深入的自主探索从而更好的理解相应的变量是如何影响卷积神经网络的,通过对这些差异的理解用户可以在实际对神经网络模型进行修改的过程中更加有效率的找到关键问题所在。为了解决上述技术问题本专利技术采用如下的技术方案:一种基于差异比较的卷积神经网络可视分析方法,包括以下步骤:(1)差异网络设计和构建;使用Tensorflow框架定义出基本的网络结构,包括网络的层数、每层的结构、激活函数、池化层大小和池化策略、输入批大小以及优化策略;使用基本卷积神经网络做为基础参照网络,它由三层神经元组成,第一层为卷积核数量为32个,卷积核尺寸为5*5的卷积层,第二层为卷积核数量为64个,卷积核尺寸5*5的卷积层,第三层为包含1024个神经元的全连接层,所有的激活函数均为Sigmoid函数;接下来将第一层卷积层的激活函数改换成Relu函数,将此网络作为对比网络,将此两个网络作为差异分析的对象;(2)训练模型提取参数;定义好需要进行对比的两个网络后,使用MNIST手写数字图片集对网络进行训练,规定两个网络的损失函数都为交叉熵,训练的步数均为2000步,以此保证结果不受训练步长和目标函数的影响,训练完成后使用Python提取出模型的参数,包括分类准确率、卷积核参数、卷积层输出和偏移量,取出参数后使用Numpy计算库进行参数的余弦相似度计算得出参数的相似程度,然后对参数进行MDS计算以此方便后续的聚类分析;(3)参数敏感度分析:首先对网络模型的参数进行敏感度分析以此确定该参数是否具有展示的分析的价值,对学习率、卷积核尺寸以及输入数量进行敏感分析,分析的方式是对比结果变化的百分比与参数变化的百分比,将这个比值作为敏感值,然后按照敏感值从大到小的顺序选取前N个参数作为展示参数;接下来分析激活函数类型、损失函数类型和池化策略,将训练完成后的模型精确度变化百分比作为敏感值,同样取前N个敏感参数进行下一步分析;对于使用的两个网络进行敏感度分析后得出需要重点展示的参数为:卷积层结构、激活函数类型、全连接层神经元个数以及池化策略;(4)差异展示;将要进行差异对比的两个网络的结构数据以及模型参数都输入到设计好的差异分析系统中,通过系统提供的差异展示组件对两者的差异进行对比展示,该展示方式区别于普通对照展示的重要特点是将两个不同的网络整合成一个统一的差异组件进行展示,避免了用户对变量进行来回观察造成可能的分析混乱。进一步,所述步骤(4)中,分析过程如下:(4-1)差异概览分析设计差异概览组件为用户展示最为直观的差异信息,该组件将两个不同的网络整合成一个差异网络,它包括两个网络的结构差异、卷积层参数差异、激活函数差异、卷积层输出差异以及全连接层的差异;使用太阳图映射卷积层的差异,中间的同心圆映射卷积层的卷积核尺寸以及数量,外围的四个直角扇形分别映射输入数量、输入尺寸、卷积核均值以及偏移量均值。使用像素图展示卷积层输出的差异情况,其中x轴表示基础网络的卷积层输出编号,y轴表示对照网络的卷积层输出编号,相应位置上像素点的颜色越红,代表对应下标的输出差异越大;通过对差异概览组件的观察用户可以快速锁定网络差异的关键点所在;(4-2)差异探索分析当用户对差异概览组件的相应部分比如卷积层差异概览、卷积层输出差异像素图等进行点击交互时,差异探索组件就会对这些差异概览数据进行更加深入的展示,通过对两个网络的卷积核进行MDS降维分析得出它们之间的相关性大小,并且提供多种对比方式满足用户的分析需求,分别展示单独网络内部的卷积核聚类信息也可以同时将两个网络的卷积核二维分布展示在一起以观察他们之间的聚类差异;另外差异探索图还可以对比如全连接层的权值以及偏移量等数值型参数进行更加详细的差异展示,通过对关键差异点信息的详细分析用户能够更加深入的对差异数据进行理解从而得出差异变量对网络的影响情况。再进一步,所述步骤(4-1)中,通过对差异概览组件的观察用户快速锁定网络差异的关键点所在,观察过程为:首先观察卷积层输出的像素图,看是否存在红色密集的情况以此判断输出的差异的情况;然后观察卷积层结构差异是否很大;最后看全连接层的权重差异,当其他的差异因素不太明显时,全连层对特征的组合能力的差异可能会称为性能差异的关键。本专利技术的技术构思是对两个设计上存在差异的卷积神经网络进行训练,然后取出训练后的模型参数并对参数进行敏感度分析以此判断参数是否有展示的价值。通过使用设计的差异分析系统对两个模型的参数差异进行展示,用户首先观察差异概览信息找到可能的关键差异点,然后通过系统提供的交互分析手段对可能的关键差异信息进行更加详细深入的可视分析,通过这样的方式用户可以更加深刻的理解模型设计时某些参数的差异会对模型效果产生何种影响,这些验证得到的结论可以让用户在实际调试网络模型的时候更加高效的定位问题。本专利技术的有益效果是:有效实现差异化可视分析,通过对这些差异的理解用户可以在实本文档来自技高网
...

【技术保护点】
1.一种基于差异比较的卷积神经网络可视分析方法,其特征在于,所述方法包括以下步骤:(1)差异网络设计;使用Tensorflow框架定义出基本的网络结构,包括网络的层数、每层的结构、激活函数、池化层大小和池化策略、输入批大小以及优化策略;使用基本卷积神经网络做为基础参照网络,它由三层神经元组成,第一层为卷积核数量为32个,卷积核尺寸为5*5的卷积层,第二层为卷积核数量为64个,卷积核尺寸5*5的卷积层,第三层为包含1024个神经元的全连接层,所有的激活函数均为Sigmoid函数;接下来将第一层卷积层的激活函数改换成Relu函数,将此网络作为对比网络,将此两个网络作为差异分析的对象;(2)训练模型提取参数;定义好需要进行对比的两个网络后,使用MNIST手写数字图片集对网络进行训练,规定两个网络的损失函数都为交叉熵,训练的步数均为2000步,以此保证结果不受训练步长和目标函数的影响,训练完成后使用Python提取出模型的参数,包括分类准确率、卷积核参数、卷积层输出和偏移量,取出参数后使用numpy计算库进行参数的余弦相似度计算得出参数的相似程度,然后对参数进行MDS计算以此方便后续的聚类分析;(3)参数敏感度分析:首先对网络模型的参数进行敏感度分析以此确定该参数是否具有展示的分析的价值,对学习率、卷积核尺寸以及输入数量进行敏感分析,分析的方式是对比结果变化的百分比与参数变化的百分比,将这个比值作为敏感值,然后按照敏感值从大到小的顺序选取前N个参数作为展示参数;接下来分析激活函数类型、损失函数类型和池化策略,将训练完成后的模型精确度变化百分比作为敏感值,同样取前N个敏感参数进行下一步分析;对于使用的两个网络进行敏感度分析后得出需要重点展示的参数为:卷积层结构、激活函数类型、全连接层神经元个数以及池化策略;(4)差异展示;将要进行差异对比的两个网络的结构数据以及模型参数都输入到设计好的差异分析系统中,通过系统提供的差异展示组件对两者的差异进行对比展示,该展示方式区别于普通对照展示的重要特点是将两个不同的网络整合成一个统一的差异组件进行展示,避免了用户对变量进行来回观察造成可能的分析混乱。...

【技术特征摘要】
1.一种基于差异比较的卷积神经网络可视分析方法,其特征在于,所述方法包括以下步骤:(1)差异网络设计;使用Tensorflow框架定义出基本的网络结构,包括网络的层数、每层的结构、激活函数、池化层大小和池化策略、输入批大小以及优化策略;使用基本卷积神经网络做为基础参照网络,它由三层神经元组成,第一层为卷积核数量为32个,卷积核尺寸为5*5的卷积层,第二层为卷积核数量为64个,卷积核尺寸5*5的卷积层,第三层为包含1024个神经元的全连接层,所有的激活函数均为Sigmoid函数;接下来将第一层卷积层的激活函数改换成Relu函数,将此网络作为对比网络,将此两个网络作为差异分析的对象;(2)训练模型提取参数;定义好需要进行对比的两个网络后,使用MNIST手写数字图片集对网络进行训练,规定两个网络的损失函数都为交叉熵,训练的步数均为2000步,以此保证结果不受训练步长和目标函数的影响,训练完成后使用Python提取出模型的参数,包括分类准确率、卷积核参数、卷积层输出和偏移量,取出参数后使用numpy计算库进行参数的余弦相似度计算得出参数的相似程度,然后对参数进行MDS计算以此方便后续的聚类分析;(3)参数敏感度分析:首先对网络模型的参数进行敏感度分析以此确定该参数是否具有展示的分析的价值,对学习率、卷积核尺寸以及输入数量进行敏感分析,分析的方式是对比结果变化的百分比与参数变化的百分比,将这个比值作为敏感值,然后按照敏感值从大到小的顺序选取前N个参数作为展示参数;接下来分析激活函数类型、损失函数类型和池化策略,将训练完成后的模型精确度变化百分比作为敏感值,同样取前N个敏感参数进行下一步分析;对于使用的两个网络进行敏感度分析后得出需要重点展示的参数为:卷积层结构、激活函数类型、全连接层神经元个数以及池化策略;(4)差异展示;将要进行差异对比的两个网络的结构数据以及模型参数都输入到设计好的差异分析系统中,通过系统提供的差异展示组件对两者的差异进行对比展示,该展示方式区别于普通对照展示的重要特点是将两个不同...

【专利技术属性】
技术研发人员:孙国道赵银周志秀刘义鹏蒋莉梁荣华
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1