用于深度神经网络的混合精度量化的系统和方法技术方案

技术编号：37848231 阅读：11 留言：0更新日期：2023-06-14 22:34

提供一种使用NEMO搜索来训练可以用于DNN的混合精度量化的GNN的装置。例如，该装置生成多个GNN。该装置还基于多个GNN生成多个新GNN。该装置还生成第一DNN的序列图形。第一DNN包括可量化操作的序列，各个可量化操作包括可量化参数并且由序列图形中的不同节点来表示。该装置将序列图形输入到该GNN和新GNN中，并且基于用于降低第一DNN的可量化参数的精度的冲突目标来评估该GNN和新GNN的输出。然后，该装置基于评估从该GNN和新GNN中选择GNN。GNN将用于降低第二DNN的可量化参数的精度。低第二DNN的可量化参数的精度。低第二DNN的可量化参数的精度。

全部详细技术资料下载

【技术实现步骤摘要】
用于深度神经网络的混合精度量化的系统和方法

[0001]本公开总体上涉及深度神经网络(DNN，deep neural network)，更具体地，涉及将神经进化增强多目标优化(NEMO，Neuroevolutionary
‑
Enhanced Multi
‑
objective Optimization)用于DNN的混合精度量化。

技术介绍

[0002]DNN接收输入，向输入中的各个方面/对象分配重要性(可学习的权重和偏置)，并且生成输出。DNN广泛用于从计算机视觉到语音识别和自然语言处理的各种各样的人工智能应用。然而，许多DNN太大而无法被装配在具有有限计算资源的系统中，例如具有有限的存储器或有限的处理能力的系统中。
附图说明
[0003]通过以下结合附图的详细描述，将容易理解各实施例。为了便于描述，相似的附图标记表示相似的结构元素。在附图的图中，实施例以示例而非限制的方式来示出。
[0004]图1示出了根据各种实施例的示例DNN的架构。
[0005]图2示出了根据各种实施例的深度学习(DL，deep learning)环境。
[0006]图3是根据各种实施例的DNN系统的框图。
[0007]图4是根据各种实施例的压缩模块的框图。
[0008]图5示出了根据各种实施例的DNN的序列图形。
[0009]图6示出了根据各种实施例的NEMO搜索过程中的后代生产。
[0010]图7示出了根据各种实施例的在NEMO搜索过程...

【技术保护点】

【技术特征摘要】
1.一种用于优化混合精度量化的多个目标的方法，所述方法包括：生成多个图形神经网络(GNN)；基于所述多个GNN生成多个新GNN；生成第一DNN的序列图形，所述第一DNN包括可量化操作的序列，各个可量化操作包括可量化参数并且由所述序列图形中的不同节点来表示；将所述序列图形输入到所述多个GNN和所述多个新GNN中；基于用于降低所述第一DNN的可量化参数的精度的冲突目标，评估所述多个GNN和所述多个新GNN的输出；以及基于所述评估，从所述多个GNN和所述多个新GNN中选择GNN，所述GNN将用于降低第二DNN的可量化参数的精度。2.根据权利要求1所述的方法，其中，所述多个GNN包括第一种类的GNN和第二种类的GNN，所述第一种类中的GNN具有第一神经元架构，所述第二种类中的GNN具有与第一神经元架构不同的第二神经元架构。3.根据权利要求2所述的方法，其中，所述第一种类中的GNN具有不同的内部参数。4.根据权利要求1
‑
3中任一项所述的方法，其中，基于所述多个GNN生成多个新GNN包括：基于所述多个GNN的内部参数，生成新内部参数；以及基于所述新内部参数和所述多个GNN的神经元架构，形成所述多个新GNN。5.根据权利要求1
‑
3中任一项所述的方法，其中，评估所述多个GNN和所述多个新GNN的输出包括：基于所述多个GNN和所述多个新GNN在实现所述冲突目标方面的性能，从所述多个GNN和所述多个新GNN生成帕累托最优集，其中，所述帕累托最优集包括所述多个GNN和所述多个新GNN中的一个或多个GNN。6.根据权利要求1
‑
3中任一项所述的方法，其中，所述GNN被配置为接收所述第二DNN的序列图形作为输入，并且输出针对所述第二DNN中的每个对应层的位宽概率分布，所述位宽概率分布包括多个概率，所述多个概率中的各个概率对应不同位宽。7.根据权利要求6所述的方法，其中，基于所述多个概率从所述位宽概率分布选择位宽，所述位宽将用于降低所述第二DNN中的对应层的可量化参数的精度。8.根据权利要求1
‑
3中任一项所述的方法，其中，所述序列中的可量化操作包括卷积，所述可量化操作的可量化参数包括权重。9.根据权利要求1
‑
3中任一项所述的方法，其中，所述序列中的可量化操作包括激活函数，所述可量化操作的可量化参数包括激活。10.根据权利要求1
‑
3中任一项所述的方法，其中，所述多个目标是从由最大化DNN的任务性能、最小化DNN的模型大小、以及最小化DNN的计算复杂度组成的组中选择的。11.一个或多个非暂时性计算机可读介质，存储有指令，所述指令能够执行以执行用于优化混合精度量化的多个目标的操作，所述操作包括：生成多个图形神经网络(GNN)；基于所述多个GNN生成多个新GNN；生成第一DNN的序列图形，所述第一DNN包括可量化操作的序列，各个可量化操作包括
可量化参数并且由所述序列图形中的不同节点来表示；将所述序列图形输入到所述多个GNN和所述多个新GNN中；基于用于降低所述第一DNN的可量化参数的精度的冲突目标，评估所述多个GNN和所述多个新GNN的输出；以及基于所述评估，从所述多个GNN和所述多个新GNN中选择GNN，所述GNN将用于降低第二DNN的可量化参数的精度。12.根据权利要求11所述的一个或多个非暂时性计算机可读介质，其中，所述多个GNN包括第一种类的GNN和第二种类的GNN，所述第一种类中的GNN具有第一神经元架构，所述第二种类中的GNN具有与第一神经元架构不同的第二神经元架构。13.根据权利要求12所述的一个或多个非暂时性计算机可读介质，其中，所述第一种类中的GNN具有不同的内部参数。14.根据权利要求11
‑
13中任一...

【专利技术属性】
技术研发人员：圣地亚哥，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人