当前位置: 首页 > 专利查询>南京大学专利>正文

面向神经网络模型的基于层间剖析的输入实例验证方法技术

技术编号:22975124 阅读:74 留言:0更新日期:2019-12-31 23:34
本发明专利技术公开一种面向神经网络模型的基于层间剖析的输入实例验证方法,给定神经网络模型与其训练数据集,提取中间信息并生成对应每一层对应的子模型;对于任意待验证输入实例,输入子模型获取层间剖析后总行为profile;分析输入实例的层间剖析profile,验证该输入实例是否为有效并给出对于有效的置信度分数。本发明专利技术基于训练模型内部的层间剖析手段,利用输入实例在模型各层次剖析时的行为来分析给定输入实例的有效性,能避免已有技术需要较多不同模型相互借助的验证手段所存在的验证时间消耗巨大的弊端,能够更加准确的进行输入验证,从而能够帮助区分给定神经网络的输入实例的有效性,从而提高神经网络在实际使用中的准确性与安全性。

Input case verification method based on layer analysis for neural network model

【技术实现步骤摘要】
面向神经网络模型的基于层间剖析的输入实例验证方法
本专利技术涉及一种面向神经网络模型的基于层间剖析的输入实例验证方法,用于神经网络的测试和输入验证等
任务。
技术介绍
神经网络模型被广泛使用在现实生活的各个领域,例如图像处理、物体识别、自动驾驶等。然而,神经网络模型由于其结构复杂性与不可解释性,通常来说,对于给定训练完成的神经网络模型,现实生活中往往将其用于各式各样的场景并且得到好的结果。然而由于模型训练的特性,天然对于不同场景的输入会存在适用或不适用的情况,若不区分适用性进行现实部署,将有可能造成神经网络模型效果异常(例如,自动驾驶汽车若用于不使用的场景例如极端天气或处理极端曝光输入图片,有可能无法正常避障发生严重交通事故)。因此,对于神经网络模型对于输入的自动验证其是否适用(或是否有效)则至关重要。当前已经有不少工作关注无效输入的问题,但是在使用上有一定的局限性。首先,不少工作核心是基于距离评估的方法,将未知输入与训练数据进行距离评测,从而判断其有效性,这一方式受制于训练数据的规模,难以应用到现实中往往要求大规模训练得到的神经本文档来自技高网...

【技术保护点】
1.一种面向神经网络模型的基于层间剖析的输入实例验证方法,其特征在于,包括如下步骤:/n步骤一:利用给定神经网络模型与其对应的训练数据,将训练数据输入给定神经网络模型,提取训练过程中数据在模型各中间层次的中间信息,并根据中间信息训练各层次对应的子模型,每一个子模型包含给定神经网络模型从输入层到对应中间层次的知识并模拟其预测行为;/n步骤二:利用步骤一获取的各中间层次对应的子模型,对于待验证的输入实例收集按照层次递增在各层次对应子模型上的预测行为snapshot,并汇总形成输入实例在所有子模型中的总行为profile;/n步骤三:基于步骤二获取的给定输入实例对应的层次剖析所获取的总行为profi...

【技术特征摘要】
1.一种面向神经网络模型的基于层间剖析的输入实例验证方法,其特征在于,包括如下步骤:
步骤一:利用给定神经网络模型与其对应的训练数据,将训练数据输入给定神经网络模型,提取训练过程中数据在模型各中间层次的中间信息,并根据中间信息训练各层次对应的子模型,每一个子模型包含给定神经网络模型从输入层到对应中间层次的知识并模拟其预测行为;
步骤二:利用步骤一获取的各中间层次对应的子模型,对于待验证的输入实例收集按照层次递增在各层次对应子模型上的预测行为snapshot,并汇总形成输入实例在所有子模型中的总行为profile;
步骤三:基于步骤二获取的给定输入实例对应的层次剖析所获取的总行为profile,分析其层次预测行为snapshot的有效性以及总行为profile的有效性,并给出有效性置信度分数,并评估有效性。


2.如权利要求1所述的面向神经网络模型的基于层间剖析的输入实例验证方法,其特征在于,所述步骤一中,提供给定神经网络模型及其训练数据集,提取训练过程各层次中间信息,其中中间信息包括中间层次每一层神经元在训练过程中得到的模型参数信息、各神经元输入值和输出值;其中参数信息用于记录当前模型通过训练过程从训练数据集中学习到的知识,输入值和输出值用于为后续子模型的训练过程提供训练数据。


3.如权利要求1所述的面向神经网络模型的基于层间剖析的输入实例验证方法,其特征在于,所述步骤一中,层次k对应的子模型是类似给定神经网络模型结构的神经网络模型,其包含两部分结构,第一部分继承给定神经网络在原训练过程后获得的后模型从输入层到对应层次k的所有得到的模型参数信息及其对应模型结构,第二部分利用基础元模型连接层次k神经元与预测输出神经元,并利用步骤一记录的k层次神经元中间信息和原始训练集对应预测值标记进行重新训练,并获取该部分训练后的参数信息,两部分参数合并则得到带参数的子模型结构;所述基础元模型常指代线性回归模型。


4.如权利要求1所述的面向神经网络模型的基于层间剖析的输入实例验证方法,其特征在于,所述步骤二中,所述输入实例在各层次对应子模型上的预测行为snapshot是指利用输入实例传入各层次对应的子模型进行预测后,所得到的预...

【专利技术属性】
技术研发人员:徐经纬王慧妍许畅马晓星吕建
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1