【技术实现步骤摘要】
用于处理深度学习网络的自动多目标硬件优化
[0001]本公开总体涉及机器学习,并且更具体地,涉及用于处理深度学习网络的硬件优化。
技术介绍
[0002]随着神经网络的能力指向深度学习的更多目标,此类网络以渐增数量的操作和设置运行。然而,神经网络处理的有效性受到用于网络推理的硬件选择的极大影响。
[0003]对深度学习工作负载的性能的优化通常为高度耗时的工作。当性能可由一些不同性能指标(诸如吞吐量、延迟、核覆盖和功率消耗)来限定时,尤其如此。通常,针对深度学习工作负载启用的优化过程很大程度上手动地执行。
[0004]例如,某些启发式方法可用于将各种张量映射至板载存储器,或将原子操作映射至板载计算核。所得的网络性能通常显著地取决于这种硬件映射的高效性。此外,适用的性能测量的任何调整可能需要重复硬件映射,而进一步增加操作的成本。
技术实现思路
[0005]根据本公开的一个方面,提供了一种装置,包括:获取组件,用于获取用于处理深度学习工作负载的多个性能指标的客户偏好;生成组件,用于生成所述深度学习工作 ...
【技术保护点】
【技术特征摘要】
1.一种装置,包括:获取组件,用于获取用于处理深度学习工作负载的多个性能指标的客户偏好;生成组件,用于生成所述深度学习工作负载的工作负载表示;提供组件,用于将所述工作负载表示提供至机器学习处理以生成工作负载可执行文件,所述工作负载可执行文件包括基于所述多个性能指标的客户偏好的硬件映射;以及应用组件,用于将所述工作负载可执行文件应用于对所述深度学习工作负载的处理。2.根据权利要求1所述的装置,其中所述提供组件包括用于利用强化学习处理的组件。3.根据权利要求2所述的装置,其中所述强化学习处理包括以下项中的一者或两者:通过多个策略梯度学习者进行处理;或者通过多个基于搜索的动作者进行处理。4.根据权利要求3所述的装置,其中所述强化学习处理包括将来自所述多个策略梯度学习者和所述多个基于搜索的动作者两者的经验提供至一个或多个重放缓冲器。5.根据权利要求3所述的装置,其中所述基于搜索的动作者包括遗传算法动作者。6.根据权利要求5所述的装置,其中所述遗传算法包括神经进化。7.根据权利要求1所述的装置,其中所述应用组件包括用于将所述工作负载可执行文件应用于推理处理的组件。8.根据权利要求1所述的装置,其中所述客户偏好包括用于所述多个性能指标中的一者或多者的加权。9.根据权利要求8所述的装置,其中所述客户偏好还包括用于所述多个性能指标中的一者或多者的阈值。10.根据权利要求8所述的装置,其中所述多个性能指标包括吞吐量、延迟、核覆盖和功率消耗中的一者或多者。11.一种装置,包括:一个或多个处理器;以及用于存储数据的存储器,该数据包括用于一个或多个神经网络的数据;其中所述一个或多个处理器用于:获取用于处理深度学习工作负载的多个性能指标的客户偏好;生成所述深度学习工作负载的工作负载表示;将所述工作负载表示提供至机器学习处理以生成工作负载可执行文件,所述工作负载可执行文件包括基于所述多个性能指标的客户偏好的硬件映射,所述机器学习处理包括强化学习...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。