【技术实现步骤摘要】
【国外来华专利技术】配置用于执行层描述符列表的具有功率效率的深度神经网络模块
技术介绍
在诸如人脑等生物神经系统中,在信息处理和通信模式之后,对深度神经网络(“DNN”)进行松散建模。DNN可以用来解决复杂的分类问题,诸如但不限于对象检测、语义标记和特征提取。结果,DNN构成了很多人工智能(“AI”)应用的基础,诸如计算机视觉、语音识别和机器翻译。在很多领域,DNN都可以达到或甚至超过人类的准确性。DNN的高级性能源于它们在对大数据集使用统计学习以获取输入空间的有效表示之后从输入数据中提取高级特征的能力。但是,DNN的优越性能是以高计算复杂度为代价的。诸如图形处理单元(“GPU”)等高性能通用处理器通常用于提供很多DNN应用所需要的高水平计算性能。尽管诸如GPU等通用处理器可以为实现DNN提供高水平的计算性能,但是这些类型的处理器通常不适合在低功耗至关重要的计算设备中长时间执行DNN操作。例如,诸如GPU等通用处理器可能不适合在诸如智能手机或替代/虚拟现实(AR/VR)设备等电池供电的便携式设备中执行长时间运行的DNN任务,其中需要降低功耗以延长电池 ...
【技术保护点】
1.一种神经网络处理器,包括:/n一个或多个神经元;/n第一存储器设备,用于存储层描述符列表,所述层描述符列表包括:/n至少一个存储器到存储器(M2M)描述符,以及/n至少一个操作描述符;/n第二存储器设备,用于存储将由所述一个或多个神经元操作的数据;以及/n控制器,被配置为:/n执行所述至少一个M2M描述符,以执行M2M操作,将要由所述一个或多个神经元操作的所述数据从主机计算设备的存储器传输到所述第二存储器设备,以及/n执行存储在所述第一存储器设备中的至少一个操作描述符,以致使所述一个或多个神经元对所述第二存储器设备中的所述数据执行操作。/n
【技术特征摘要】
【国外来华专利技术】20170417 US 62/486,432;20180411 US 15/951,1061.一种神经网络处理器,包括:
一个或多个神经元;
第一存储器设备,用于存储层描述符列表,所述层描述符列表包括:
至少一个存储器到存储器(M2M)描述符,以及
至少一个操作描述符;
第二存储器设备,用于存储将由所述一个或多个神经元操作的数据;以及
控制器,被配置为:
执行所述至少一个M2M描述符,以执行M2M操作,将要由所述一个或多个神经元操作的所述数据从主机计算设备的存储器传输到所述第二存储器设备,以及
执行存储在所述第一存储器设备中的至少一个操作描述符,以致使所述一个或多个神经元对所述第二存储器设备中的所述数据执行操作。
2.根据权利要求1所述的神经网络处理器,其中所述至少一个操作描述符包括指定将由所述一个或多个神经元执行的所述操作的字段,并且其中所述操作包括:
加法合并运算,
标量乘法和加法运算,
卷积运算,
反卷积运算,
最大池化运算,或者
完全连接层运算。
3.根据权利要求1所述的神经网络处理器,其中所述至少一个操作描述符包括指定将由所述一个或多个神经元在所述操作期间使用的激活函数的类型的字段。
4.根据权利要求1所述的神经网络处理器,其中所述层描述符列表还包括分支描述符,所述分支描述符在被执行时将致使所述控制器:
确定条件是否已经满足;以及
响应于确定所述条件已经满足,致使所述层描述符列表中的描述符的执行从第一描述符分支到第二描述符。
5.根据权利要求1所述的神经网络处理器,其中所述层描述符列表还包括:
同步描述符,在由所述控制器执行时将致使所述控制器同步所述一个或多个神经元;
配置描述符,在由所述控制器执行时修改所述神经网络模块的配置状态;或者
主机通信描述符,在由所述控制器执行时将致使所述控制器向所述主机计算设备传输数据。
6.一种计算机实现的方法,包括:
将层描述符列表存储在神经网络模块的存储器中,所述层描述符列表包括:
至少一个存储器到存储器(M2M)描述符,以及
至少一个操作描述符;通过所述神经网络模块执行所述至少一个M2M描述符,以执行M2M操作,...
【专利技术属性】
技术研发人员:A·A·安巴德卡,K·D·塞多拉,L·M·瓦尔,B·博布罗夫,G·彼得,C·B·麦克布赖德,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。