卷积神经网络中分类决策的验证制造技术

技术编号:29712867 阅读:23 留言:0更新日期:2021-08-17 14:45
在一个方面中,本发明专利技术涉及一种计算机实现的方法,用于提供一种用于验证卷积神经网络(CNN)的视觉分类架构及其决策的计算机实现的方法。该方法包括:访问(S1)具有卷积神经网络(CNN)的存储器(MEM),所述卷积神经网络(CNN)针对分类成目标类集合(tc)的视觉分类任务被训练;对输入图像(12)使用(S2)卷积神经网络(CNN),并且在卷积神经网络(CNN)的前向传递之后,在后向传递中:应用(S3)对比逐层相关性传播算法(CLRP)或者应用(S4)自下而上注意力模式(BUAP),所述自下而上注意力模式(BUAP)由卷积神经网络(CNN)隐式学习,用于提供(S5)验证信号(vs)。

【技术实现步骤摘要】
【国外来华专利技术】卷积神经网络中分类决策的验证近年来,卷积神经网络(下文中缩写为CNN)在如医学成像和计算机视觉的不同技术应用领域中已经实现了巨大的成功。受益于大规模训练数据(如ImageNet),CNN能够同时学习滤波和图像合成。已经采用了各种方法来进一步增加CNN的推广能力。例如,CNN可以应用于几个
中的分类任务,如医疗成像(例如将健康图像部分与病变区分开)或生产(例如将产品分类为废物或非废物)。然而,如果使用经训练的CNN,则分类结果可能不贯穿于网络架构经受逐步验证。因此,CNN的内部工作是“隐藏的”,诸如CNN的最终决策对于网络中的每个神经元都是不可追溯的,并且因此是不可知的。提供的结果是可信的。然而,在其中安全是关键的应用中,为了增强决策安全性和质量,有必要提供更多的信任。为了提供对于CNN的验证的更好理解和基础,现有技术中已知几种方法。第一种方法是使用基于反向传播的机制,该基于反向传播的机制针对通过为输入矢量(例如图像)生成所谓的显著性图来解释CNN的决策。显著性图充当CNN分类决策的(直观)解释。在计算机视觉中,显著性图被定义为2D拓扑图,其以数字比例指示视觉注意力优先级。较高的视觉注意力优先级指示感兴趣的对象不规则或对其周围环境来说很罕见。对显著性的建模有益于包括图像分割、目标检测、图像重定向、图像/视频压缩等之类的几种应用。特别地,逐层反向传播(在下文中缩写为LRP)可以用于生成这样的显著性图。论文“Bach,S.,Binder,A.,Montavon,G.,Klauschen,F.,Muller,K.R.,Samek,W.:'Onpixel-wiseexplanationsfornon-linearclassifierdecisionsbylayer-wiserelevancepropagation'.PloSone10(2015)e0130140”提出LRP以针对分类决策生成解释。然而,实验示出,LRP生成的显著性图是特定于实例的,而不是类鉴别性的。换句话说,它们独立于类信息。对于不同目标类的解释,即使是随机选取的类,也几乎是相同的。所生成的图识别相同的前景对象,而不是类鉴别性的对象。Zhang等的工作(Zhang,J.,Lin,Z.,Brandt,J.,Shen,X.,Sclaroff,S.:Top-downneuralattentionbyexcitationbackprop,在EuropeanConferenceonComputerVision,Springer(2016)543-559中)公开了CNN分类器自上而下注意力的公式,作为概率性赢家通吃的过程。然而,该论文不涉及自下而上的学习。进一步地,该论文通过否定连接类的权重来构造对比信号。本申请提出了构造对比信号的其他可能性,例如使用所有其他类来表示信号。在减法之前显著性图的归一化取决于最大值。因为LRP的守恒特性,所提出的申请没有对显著性图进行归一化。Cao,C.等的工作(Cao,C.,Liu,X.,Yang,Y.,Yu,Y.,Wang,J.,Wang,Z.,Huang,Y.,Wang,L.,Huang,C.,Xu,W.等的:Lookandthinktwice:Capturingtop-downvisualattentionwithfeedbackconvolutionalneuralnetworks,在ProceedingsoftheIEEEInternationalConferenceonComputerVision(2015)2956-2964中)能够产生类鉴别性注意力图。然而,该工作需要通过添加额外的反馈层和在反向传播期间对层进行优化来修改传统的CNN。因此,需要能够在没有对CNN的结构进行任何修改的情况下提供显著性图。经典的显著性模型基于块(矩形补片)或区域(超像素)。它们手工制作的特征通常是使用图像中的内在线索提取的,所述内在线索例如场景中的独特性、区别性或稀有性。然而,在更具挑战性的场景中,它们的性能并不令人满意。其他方法需要劳动密集型和耗时的标记过程。因此,本领域中存在对于提供用于生成显著性图的改进方法的需要。针对显著性建模的研究受到自下而上和自上而下的视觉特征或线索影响。自下而上的视觉注意力(外源性)是由刺激触发的,其中依据输入图像中的低级别的特征或线索——诸如颜色、强度、定向、形状、T型连结、X型连结等,将显著性捕获为图像位置、区域或对象的区别。视觉自下而上的注意力是利用特定的神经网络架构或计算模型明确建模的。为了能够分析或检查各个(视觉)输入和它们的特征表示之间的关系,尤其是随着CNN层越来越深,特征表示的演进,本领域中存在对于提供对CNN决策的更好理解的需要。现有技术基于反向传播的方法的缺点是它们没有提供关于内部神经元和层的信息,并且因此没有提供关于CNN特征的信息,尽管它们可能有助于解释最终的分类。为了对CNN的内部运行的更好和更详细理解,对特征的类鉴别性解释将是有帮助的。US2017/344884A1描述了语义类定位技术和系统。采用机器学习技术来将图像分类为包括对象,以及还有对象在图像内的位置这两者。机器学习技术通过前进通过神经网络的各层来学习神经元的模式。神经元的模式用于标识图像内语义类的存在,诸如对象、感觉。对比注意力图也可以用来在语义类之间进行区分。例如,对比注意力图可以用于区分图像内的不同对象,以定位对象。基于边际获胜概率创建对比注意力图。语义类被定位为边际获胜概率的单个反向传播的一部分。CN108664967A描述了一种多媒体页面显著性预测方法和系统。可以提取多媒体页面的不同元素的表示。如之前提及的,用于生成显著性图的现有技术方法的缺点是它们不够灵活。尤其是所谓的有监督方法需要劳动密集型和耗时的标记过程。因此,任意图像以及尤其是没有标记的图像可以用作输入将是有帮助的。因此,本专利技术的目的是提供一种用于改进CNN验证过程的解决方案。进一步地,还应当改进对神经网络过程的在逐层级别上以及相对于决策任务类的技术分析和监视。前面提到的所有对象都服务于这样的总体目标,即使用或应用CNN的过程的安全性应该得到改进。根据所附独立权利要求,通过验证单元、计算机程序和/或计算机程序产品来验证卷积神经网络的视觉分类架构(以及由此导出的分类决策)的方法来解决该目的。有利的方面、特征和实施例连同优点一起在从属权利要求中和以下描述中描述。在下文中,关于所要求保护的验证方法以及关于所要求保护的验证单元来描述所提出的技术。本文的特征、优点或替代实施例可以分配给其他要求保护的对象(例如,计算机程序或计算机程序产品),并且反之亦然。换句话说,针对验证单元的权利要求可以利用在方法的上下文中描述或要求保护的特征来改进,并且反之亦然。在该情况下,该方法的功能特征相应地由系统的结构单元体现,并且反之亦然。在一个方面中,本专利技术涉及一种用于验证卷积神经网络(CNN)的视觉分类架构及其分类结果的方法。该方法包括:-访问具有CNN的存储器,CNN被训练用于分类成目标类集合的视觉分类本文档来自技高网...

【技术保护点】
1.一种用于验证卷积神经网络(CNN)的视觉分类架构的计算机实现方法,包括以下方法步骤:/n-利用卷积神经网络(CNN)访问(S1)存储器(MEM),所述卷积神经网络(CNN)被训练用于分类成目标类(tc)集合的视觉分类任务;/n-对于输入图像(12)使用(S2)所述卷积神经网络(CNN),并且在所述卷积神经网络(CNN)的前向传递之后,在后向传递中:/n-应用(S3)对比逐层相关性传播算法(CLRP)或/n-应用(S4)隐式学习的自下而上注意力模式(BUAP),以验证所述卷积神经网络(CNN)的分类能力/n用于提供(S5)验证信号(vs),其中CLRP算法(S3)包括以下步骤:/n-借助于反向传播算法针对分类任务的每个目标类(tc)生成(S31)第一显著性图;/n-针对每个目标类(tc)计算(S32)虚拟类集合,所述虚拟类与相应的目标类(tc)相反;/n-借助于反向传播算法针对虚拟类集合生成(S33)第二显著性图;/n-计算(S34)第一显著性图和第二显著性图之间的差异,以用于计算最终显著性图。/n

【技术特征摘要】
【国外来华专利技术】20181119 EP 18206946.81.一种用于验证卷积神经网络(CNN)的视觉分类架构的计算机实现方法,包括以下方法步骤:
-利用卷积神经网络(CNN)访问(S1)存储器(MEM),所述卷积神经网络(CNN)被训练用于分类成目标类(tc)集合的视觉分类任务;
-对于输入图像(12)使用(S2)所述卷积神经网络(CNN),并且在所述卷积神经网络(CNN)的前向传递之后,在后向传递中:
-应用(S3)对比逐层相关性传播算法(CLRP)或
-应用(S4)隐式学习的自下而上注意力模式(BUAP),以验证所述卷积神经网络(CNN)的分类能力
用于提供(S5)验证信号(vs),其中CLRP算法(S3)包括以下步骤:
-借助于反向传播算法针对分类任务的每个目标类(tc)生成(S31)第一显著性图;
-针对每个目标类(tc)计算(S32)虚拟类集合,所述虚拟类与相应的目标类(tc)相反;
-借助于反向传播算法针对虚拟类集合生成(S33)第二显著性图;
-计算(S34)第一显著性图和第二显著性图之间的差异,以用于计算最终显著性图。


2.根据权利要求1所述的方法,其中验证信号(vs)被提供为卷积神经网络(CNN)的每一层上的每个特征的显著性图。


3.根据前述权利要求中任一项所述的方法,其中,通过应用(S3)对比逐层相关性传播算法(CLRP),生成类鉴别性和实例特定的显著性图。


4.根据权利要求2所述的方法,其中,为了应用(S4)隐式学习的自下而上注意力模式(BUAP),对反卷积CNN算法、梯度反向传播算法或逐层反向传播算法进行修改,以便针对特征而不是针对类生成显著性图。


5.根据权利要求1所述的方法,其中针对特定目标类(tc)计算虚拟类是通过以下各项执行的:
-将目标类集合中的任何其他类定义为虚拟类,或者通过
-将目标类集合中的所有其他目标类定义为虚拟类,或者通过
-通过生成附加类并使用权重将其与最后一层连接来构造虚拟类,其中所述权重是前向传递的逆权重。


6.根据权利要求4所述的方法,其中应用(S4)自下而上注意力模式(BUAP)包括:
-收集和存储CNN的所有特征,其中特征包括针对输入图像...

【专利技术属性】
技术研发人员:顾金东
申请(专利权)人:西门子股份公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1