用于神经网络修剪和再训练的自动阈值制造技术

技术编号：18713360 阅读：33 留言：0更新日期：2018-08-21 23:03

实施例包括一种方法，该方法包括：使用阈值对具有多个层的神经网络的层进行修剪；以及使用不同的阈值来重复对所述神经网络的所述层进行修剪，直到经修剪的层的修剪误差达到修剪误差容限为止。

Automatic thresholds for pruning and retraining of neural networks

An embodiment includes a method of pruning layers of a neural network with multiple layers using thresholds, and of repeatedly pruning the layers of the neural network using different thresholds until the pruning error of the pruned layer reaches the pruning error tolerance.

全部详细技术资料下载

【技术实现步骤摘要】
用于神经网络修剪和再训练的自动阈值相关申请的交叉引用本申请要求于2017年2月10日提交的美国临时专利申请No.62/457,806的优先权，针对所有目的将其内容以全文引用的方式并入本文。
本公开涉及神经网络的修剪和再训练，特别是使用自动阈值对神经网络进行修剪和再训练。
技术介绍
深度学习架构，尤其是卷积深度神经网络已经用于人工智能(AI)和计算机视觉领域。这些架构已经展示出对于包括视觉对象识别、检测和分割在内的任务产生了结果。然而，这些架构可能具有大量的参数，导致较高的计算负载和增加的功耗。
技术实现思路
实施例包括一种方法，该方法包括：使用阈值对具有多个层的神经网络的层进行修剪；以及使用不同的阈值来重复对所述神经网络的所述层进行修剪，直到经修剪的层的修剪误差达到修剪误差容限为止。实施例包括一种方法，该方法包括：重复以下步骤：使用自动确定的阈值对神经网络的多个层进行修剪；以及仅使用修剪之后保留的权重对所述神经网络进行再训练。实施例包括一种系统，该系统包括：存储器；以及处理器，耦接到所述存储器并被配置为：使用阈值对具有多个层的神经网络的层进行修剪；以及使用不同的阈值来重复对所述神经网络的所述层进行修剪，直到经修剪的层的修剪误差达到修剪误差容限为止。附图说明图1A～图1B是根据一些实施例的用于自动确定阈值的技术的流程图。图2是根据一些实施例的再训练操作的流程图。图3A～图3B是根据一些实施例的再训练操作的流程图。图4是根据一些实施例的自动确定阈值、修剪和再训练的技术的流程图。图5是示出了根据一些实施例的再训练操作的一组曲线。图6是包括根据一些实施例的修剪和再训练...

【技术保护点】
1.一种方法，包括：使用阈值对具有多个层的神经网络的层进行修剪；以及使用不同的阈值重复对所述神经网络的所述层进行修剪，直到经修剪的层的修剪误差达到修剪误差容限为止。

【技术特征摘要】
2017.02.10 US 62/457,806;2017.04.14 US 15/488,4301.一种方法，包括：使用阈值对具有多个层的神经网络的层进行修剪；以及使用不同的阈值重复对所述神经网络的所述层进行修剪，直到经修剪的层的修剪误差达到修剪误差容限为止。2.根据权利要求1所述的方法，还包括针对所述神经网络的每个层：初始化所述修剪误差容限；初始化所述阈值；以及重复以下步骤，直到针对所述层的修剪权重的百分比在针对所述层的范围内为止：重复以下步骤，直到所述修剪误差达到所述修剪误差容限为止：使用所述阈值对所述神经网络的所述层进行修剪；计算经修剪的层的修剪误差；将所述修剪误差与所述修剪误差容限进行比较；以及响应于所述比较来改变所述阈值；计算经修剪的层的修剪权重的百分比；以及响应于所述修剪权重的百分比来改变所述修剪误差容限。3.根据权利要求1所述的方法，还包括：使用不同的修剪误差容限来重复对所述层重复进行修剪，直到针对所述层的修剪权重的百分比在针对所述层的范围内为止。4.根据权利要求3所述的方法，其中，所述神经网络的不同类型的层针对所述修剪权重的百分比具有不同的范围。5.根据权利要求1所述的方法，其中，对所述神经网络的所述层进行修剪包括：如果权重的量值小于所述阈值，则将所述权重设置为零。6.根据权利要求1所述的方法，其中，对所述神经网络的所述层进行修剪包括：如果权重的量值小于按缩放因子缩放的所述阈值，则将所述权重设置为零。7.根据权利要求6所述的方法，其中，所述缩放因子是所述层的权重的标准差。8.根据权利要求1所述的方法，还包括：通过将权重误差的量值除以经修剪的权重的数量来计算所述修剪误差。9.根据权利要求1所述的方法，还包括进行以下操作以产生所述不同的阈值：如果所述修剪误差小于所述修剪误差容限，则增加所述阈值；以及如果所述修剪误差大于所述修剪误差容限，则降低所述阈值。10.根据权利要求1所述的方法，还包括：对于所述神经网络的每一层执行重复对所述神经网络的层进行修剪。11.根据权利要求1所述的方法，还包括：在经修剪的层的修剪误差达到所述修剪误差容限之后，使用所述阈值迭代地...

【专利技术属性】
技术研发人员：冀正平，约翰·韦克菲尔德·布拉泽斯，伊利亚·奥夫相尼科夫，沈恩寿，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人