用于基于网络灵敏度和量化误差选择深度神经网络的数字格式的方法和系统技术方案

技术编号：31501723 阅读：18 留言：0更新日期：2021-12-22 23:19

本发明专利技术涉及用于基于网络灵敏度和量化误差选择深度神经网络的数字格式的方法和系统。所述方法包括：确定所述DNN相对于所述一组网络参数中的每一个网络参数的灵敏度；针对多个候选数字格式中的每一个候选数字格式：根据所述候选数字格式确定与对所述一组网络参数中的每一个网络参数进行量化相关联的量化误差；基于所述灵敏度和所述量化误差生成由所述一组网络参数的量化引起的所述DNN的输出中的误差的估计；基于所述估计的误差生成局部误差；并且选择所述多个候选数字格式中局部误差最小的候选数字格式作为所述一组网络参数的所述数字格式。述数字格式。述数字格式。

全部详细技术资料下载

【技术实现步骤摘要】
用于基于网络灵敏度和量化误差选择深度神经网络的数字格式的方法和系统

[0001]本申请涉及用于选择表示深度神经网络(DNN)的网络参数的数字格式的方法和系统。

技术介绍

[0002]深度神经网络(DNN)是人工神经网络的一种形式，包括可用于机器学习应用程序的多个互连层。特别地，DNN可用于信号处理应用程序，包括但不限于图像处理和计算机视觉应用程序。图1示出了包括多个层102
‑
1、102
‑
2、102
‑
3的示例性DNN 100。每一层102
‑
1、102
‑
2、102
‑
3接收输入数据，并且根据层来处理该输入数据以产生输出数据。输出数据要么作为输入数据提供给另一层，要么作为DNN的最终输出数据输出。例如，在图1的DNN 100中，第一层102
‑
1接收到DNN 100的原始输入数据104，并且根据第一层102
‑
1处理输入数据以产生输出数据。第一层102
‑
1的输出数据成为第二层102
‑
2的输入数据，该第二层根据第二层102
‑
2处理该输入数据以产生输出数据。第二层102
‑
2的输出数据成为第三层102
‑
3的输入数据，该第三层根据第三层102
‑
3处理该输入数据以产生输出数据。第三层102
‑
3的输出数据作为DNN的输出数据106输出。
...

【技术保护点】

【技术特征摘要】
1.一种用于确定表示深度神经网络“DNN”的一组两个或多个网络参数的数字格式，用于配置硬件逻辑以实现所述DNN的计算机实现的方法(800、1300)，所述方法(800、1300)包括：确定所述DNN相对于所述一组网络参数中的每一个网络参数的灵敏度(802)；针对多个候选数字格式中的每一个候选数字格式：根据所述候选数字格式确定与对所述一组网络参数中的每一个网络参数进行量化相关联的量化误差(804)；基于所述灵敏度和所述量化误差生成对由所述一组网络参数的量化引起的所述DNN的输出中的误差的估计(806)；以及基于所述估计的误差生成局部误差(808)；以及选择所述多个候选数字格式中所述局部误差最小的候选数字格式作为所述一组网络参数的所述数字格式(810)。2.如权利要求1所述的方法(800、1300)，其中确定所述DNN相对于网络参数的所述灵敏度包括：响应于测试数据来确定所述DNN的模型的输出；基于所述DNN相对于所述网络参数的所述输出确定一个或多个值的偏导数；以及根据所述一个或多个偏导数确定所述灵敏度。3.如权利要求2所述的方法(800、1300)，其中所述一个或多个偏导数通过反向传播技术来确定。4.如权利要求2所述的方法(800、1300)，其中所述DNN的所述模型是所述DNN的浮点模型。5.如权利要求2所述的方法(800、1300)，其中所述DNN的所述输出包括单个值，并且基于所述DNN的所述输出的所述一个或多个值包括所述单个输出值；或者其中所述DNN的所述输出包括多个值，并且基于所述DNN的所述输出的所述一个或多个值包括所述多个输出值中的每一个输出值。6.如权利要求2所述的方法(800、1300)，其中所述DNN的所述输出包括多个值，并且基于所述DNN的所述输出的所述一个或多个值包括基于所述多个输出值的单个汇总值。7.如权利要求6所述的方法(800、1300)，其中所述汇总值是所述多个输出值的总和或所述多个输出值中的最大值。8.如权利要求1至7中任一项所述的方法(800、1300)，其中生成由所述一组网络参数的量化引起的所述DNN的所述输出中的所述误差的所述估计包括计算所述量化误差的加权总和，其中与网络参数的量化误差相关联的所述权重是所述DNN相对于所述网络参数的灵敏度。9.如权利要求1至7中任一项所述的方法(800、1300)，其中生成由所述一组网络参数的量化引起的所述DNN的所述输出中的所述误差的所述估计包括计算所述量化误差的加权总和的绝对值，其中与网络参数的量化误差相关联的所述权重是所述DNN相对于所述网络参数的所述灵敏度。10.如权利要求1至7中任一项所述的方法(800、1300)，其中生成由所述一组网络参数的量化引起的所述DNN的所述输出中的所述误差的所述估计包括：(i)针对所述集合中的每
一个网络参数，计算所述网络参数的所述量化误差的乘积的绝对值和所述DNN相对于所述网络参数的所述灵敏度；以及(ii)计算所述绝对值的总和。11.如权利要求1至7中任一项所述的方法(800、1300)，其中生成由所述一组网络参数的量化引起的所述DNN的所述输出中...

【专利技术属性】
技术研发人员：J，
申请(专利权)人：想象技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人