基于人工神经网络类别的修剪制造技术

技术编号：18351339 阅读：47 留言：0更新日期：2018-07-02 01:11

本发明专利技术涉及基于人工神经网络类别的修剪。实现和使用用于针对特定监视状况配置人工神经网络的技术的方法和包括计算机程序产品的装置。选择监视状况特有的多个对象类别。对象类别形成人工神经网络针对其被训练的对象类别的总数的子集。访问包括人工神经网络内的神经元的激活频率值的数据库。激活频率值是对象类别的函数。从人工神经网络中去除具有低于所选择的对象类别的子集的阈值的激活频率值的那些神经元。

全部详细技术资料下载

【技术实现步骤摘要】
基于人工神经网络类别的修剪
技术介绍
本专利技术涉及一种人工神经网络，更具体地，涉及一种用于对象识别和验证的人工神经网络。近年来，对这种人工神经网络的改进主要是由于网络扩展和训练数据的增加。然而，复杂的人工神经网络架构通常包含数千万或数亿个参数。尽管这样的人工神经网络产生良好的精度，但是大量的参数可能使得部署变得不可行，特别是在经常具有有限计算能力的嵌入式系统上。随着人工神经网络规模的不断扩大，对人工神经网络的压缩越来越受到关注，以保持改进，同时使人工神经网络在具有有限计算能力的系统中得以实现。由于人工神经网络通常非常大，如上所述，它们通常可能是“过度参数化的”。这使得能够在不显著影响人工神经网络的性能的前提下去除参数(如权重和偏差)或整个神经元。这个过程通常被称为“修剪(pruning)”人工神经网络。当神经元被去除时，能够回溯(back-trace)该神经元的计算。然后可以看出，通向该神经元的所有权重可被安全地去除。还能够跟踪神经元输出并去除从该神经元而来的权重。然而，在修剪过程中识别哪些神经元被去除以及以能够获得性能的方式实现修剪过程并不轻松。修剪可应用于包含可训练参数的层，传统上完全连接的层和卷积(convolutional)层。这有助于简化和加速计算。例如，从完全连接的层中去除神经元相当于略过在矩阵行和向量之间的点积。结果，矩阵变小。从卷积层中去除神经元意味着略过一个矩阵行和一个矩阵列之间的点积，这与跳过一个卷积相同。神经元的去除将在下面的详细说明中进一步详细讨论。通过在训练/测试阶段期间分析神经元并且从所得到的识别哪些神经元“死亡”(即哪些神经元很少...
基于人工神经网络类别的修剪

【技术保护点】
1.一种用于针对特定监视状况配置人工神经网络的方法，所述方法包括：选择所述监视状况特有的多个对象类别，其中所述对象类别形成对象类别的总数的子集，所述人工神经网络针对所述对象类别的总数被训练；访问包括所述人工神经网络内的神经元的激活频率值的数据库，其中所述激活频率值是所述对象类别的函数；并且从所述人工神经网络中去除具有低于所选择的对象类别的子集的阈值的激活频率值的神经元，其中神经元的所去除的数量使得用于计算来自所述人工神经网络的输出所需的计算资源的减少超过用于维持关于所去除的神经元的记录所需的计算资源的增加。

【技术特征摘要】
2016.12.21 EP 16205831.71.一种用于针对特定监视状况配置人工神经网络的方法，所述方法包括：选择所述监视状况特有的多个对象类别，其中所述对象类别形成对象类别的总数的子集，所述人工神经网络针对所述对象类别的总数被训练；访问包括所述人工神经网络内的神经元的激活频率值的数据库，其中所述激活频率值是所述对象类别的函数；并且从所述人工神经网络中去除具有低于所选择的对象类别的子集的阈值的激活频率值的神经元，其中神经元的所去除的数量使得用于计算来自所述人工神经网络的输出所需的计算资源的减少超过用于维持关于所去除的神经元的记录所需的计算资源的增加。2.根据权利要求1所述的方法，其中，所述阈值是在所述人工神经网络的训练/测试程序期间针对每个类别确定的静态值。3.根据权利要求1所述的方法，其中，所述阈值是基于人工神经网络性能、针对每个类别自适应的。4.根据权利要求1所述的方法，进一步包括：基于在特定时间段内收集到的数据，对所述监视状况特有的对象类别的选择进行优化；并且针对所优化的对象类别的选择，重复所述选择、所述访问和所述去除步骤。5.根据权利要求1所述的方法，其中，所述选择、所述访问和所述去除步骤中的至少一些是响应于通过用户界面接收的用户输入来执行的。6.根据权利要求1所述的方法，其中，在完全连接的人工神经网络中，去除神经元与从形成所述人工神经网络的各个层的数学表示的矩阵去除行和列相对应，从而减少计算来自所述人工神经网络的输出所需的...

【专利技术属性】
技术研发人员：罗宾·赛博尔德，陈建丹，汉纳·比约格温斯多蒂尔，马丁·尔永奎斯特，
申请(专利权)人：安讯士有限公司，
类型：发明
国别省市：瑞典,SE

全部详细技术资料下载我是这个专利的主人