An example computing environment with DNN modules can maintain one or more bandwidth throttling mechanisms. Illustratively, the first throttling mechanism may specify the number of cycles to wait between transactions on a cooperative construction component (E. G., data bus). Illustratively, the second throttling mechanism may be a transaction count limiter, which operationally sets a threshold value for the number of transactions to be processed during a given transaction sequence, and restricts the number of transactions such as multiple transactions in flight to not exceed the set threshold value. In the illustrative operation, the average bandwidth use and peak bandwidth use can be limited when performing the two example calculated throttling parameters. Operationally, using the constructed bandwidth control, DNN's processing units are optimized to process data across each transaction cycle, resulting in enhanced processing and lower power consumption.
【技术实现步骤摘要】
【国外来华专利技术】通过构造接口的带宽控制来增强DNN模块的处理性能
技术介绍
深度神经网络(“DNN”)根据生物神经系统(诸如,人脑)中的信息处理和通信模式被松散地建模。DNN可以用于解决复杂的分类问题,例如但不限于对象检测、语义标记和特征提取。因此,DNN形成了诸如计算机视觉、语音识别和机器翻译等许多人工智能(“AI”)应用的基础。DNN可以在许多这些领域中匹配或超越人类的准确度。DNN的高级别性能源于它们能够在使用大数据集上的统计学习来获得输入空间的有效表示之后,从输入数据中提取高级别特征。然而,DNN的优越性能以高计算复杂性为代价。高性能通用处理器(诸如,图形处理单元(“GPU”))通常用于提供许多DNN应用所需的高级别计算性能。虽然如GPU的通用处理器可以提供用于实现DNN的高级别计算性能,但是这些类型的处理器通常不适合用于在低功耗是关键的计算设备中长时间执行DNN操作。例如,诸如GPU的通用处理器可能不适合用于在电池供电的便携式设备(例如,智能电话或备用/虚拟现实(“AR/VR”)设备)中执行长时间运行的DNN任务,在这些便携式设备中,需要降低的功耗来延长电池寿命。还可以在非电池供电的设备(例如,诸如以太网供电(“POE”)的安全相机)中,在执行连续DNN任务(诸如,检测人类移动)的同时降低功耗。在该特定示例中,POE交换机可以仅提供有限量的功率,并且诸如安全相机的POE设备中的降低的功率可以使POE交换机的功耗和成本降低。已经开发了可以提供高性能DNN处理同时与通用处理器相比降低功耗的专用集成电路(“ASIC”)。然而, ...
【技术保护点】
1.一种用于计算环境中的增强数据处理的系统,所述系统包括:/n至少一个神经网络处理器;/n至少一个存储器组件;以及/n至少一个存储器,所述至少一个存储器与所述至少一个神经网络处理器通信,所述至少一个存储器具有存储在其上的计算机可读指令,所述计算机可读指令在由所述至少一个处理器执行时使得所述至少一个处理器:/n从所述计算环境的协作组件接收一个或多个处理参数,所述一个或多个处理参数表示处理输入数据所需的处理和存储器资源;/n计算所述计算环境的协作构造组件上的总可用存储器,以确定针对所述计算环境的负载参数;/n使用所接收的所述一个或多个处理参数和所计算的所述负载参数来计算一个或多个节流参数;/n选择所计算的所述节流参数中的一个或多个节流参数来执行;以及/n通过执行所选择的、所计算的所述一个或多个节流参数,对所述计算环境的一个或多个协作存储器组件进行节流。/n
【技术特征摘要】
【国外来华专利技术】20170417 US 62/486,432;20180411 US 15/950,6441.一种用于计算环境中的增强数据处理的系统,所述系统包括:
至少一个神经网络处理器;
至少一个存储器组件;以及
至少一个存储器,所述至少一个存储器与所述至少一个神经网络处理器通信,所述至少一个存储器具有存储在其上的计算机可读指令,所述计算机可读指令在由所述至少一个处理器执行时使得所述至少一个处理器:
从所述计算环境的协作组件接收一个或多个处理参数,所述一个或多个处理参数表示处理输入数据所需的处理和存储器资源;
计算所述计算环境的协作构造组件上的总可用存储器,以确定针对所述计算环境的负载参数;
使用所接收的所述一个或多个处理参数和所计算的所述负载参数来计算一个或多个节流参数;
选择所计算的所述节流参数中的一个或多个节流参数来执行;以及
通过执行所选择的、所计算的所述一个或多个节流参数,对所述计算环境的一个或多个协作存储器组件进行节流。
2.根据权利要求1所述的系统,其中所述节流由所述计算环境的协作DMA组件执行。
3.根据权利要求2所述的系统,其中所计算的所述节流参数包括事务限制和间隙插入。
4.根据权利要求3所述的系统,其中所述计算机可读指令还使得所述至少一个处理器:根据所计算的所述节流参数,在所述一个或多个协作存储器组件上配置协作可配置寄存器。
5.根据权利要求4所述的系统,其中由所述计算环境的所述示例性神经网络处理器处理的事务的数目受限于低于所述协作存储器组件中的一个或多个协作存储器组件的最大带宽的阈值。
6.根据权利要求5所述的系统,其中协作存储器组件包括外部构造组件。
7.根据权利要求6所述的系统,其中根据所选择的阈值由所述示例性神经网络处理器处理的事务的受限制的所述数目包括:未完成事务...
【专利技术属性】
技术研发人员:C·B·麦克布赖德,T·H·黑尔,A·A·安巴德卡,G·彼得,K·D·塞多拉,L·M·瓦尔,B·博布罗夫,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。