One embodiment provides a computing device for performing machine learning operations, which includes a decoding unit for decoding a single instruction into decoded instructions for performing one or more machine learning operations, wherein the decoding unit is used for learning operations based on the one or more machines. The parameters are used to request the scheduler to schedule the one or more machine learning operations to one of the programmable cell arrays and the fixed function cell.
【技术实现步骤摘要】
用于高效卷积的专用固定功能硬件
实施例总体上涉及数据处理,且更具体地涉及经由通用图形处理单元进行的数据处理。
技术介绍
当前的并行图形数据处理包括被开发用于对图形数据执行特定操作的系统和方法,这些特定操作如例如线性内插、曲面细分、栅格化、纹理映射、深度测试等。传统上,图形处理器使用固定功能计算单元来处理图形数据;然而,最近,图形处理器的多个部分已变得可编程,从而使得这样的处理器能够支持用于处理顶点和片段数据的更广泛种类的操作。为进一步提高性能,图形处理器通常实施处理技术(比如,流水线操作),这些处理技术试图贯穿图形流水线的不同部分来并行处理尽可能多的图形数据。具有单指令多线程(SIMT)架构的并行图形处理器被设计成最大化图形流水线中的并行处理量。在SIMT架构中,多组并行线程试图尽可能经常地一起同步执行程序指令,以提高处理效率。用于SIMT架构的软件和硬件的一般性概述可以在以下两者中找到:ShaneCook的CUDA编程(CUDAProgramming),第3章,第37-51页(2013年);和/或NicholasWilt的CUDA手册(GPU编程的综合指南(AC ...
【技术保护点】
1.一种用于执行机器学习操作的计算设备,所述计算设备包括:解码单元,用于将单指令解码为已解码指令,所述已解码指令用于执行一个或多个机器学习操作,其中,所述解码单元用于基于所述一个或多个机器学习操作的参数来请求调度器将所述一个或多个机器学习操作调度给可编程计算单元阵列和固定功能计算单元中的一个。
【技术特征摘要】
2017.04.24 US 15/494,7231.一种用于执行机器学习操作的计算设备,所述计算设备包括:解码单元,用于将单指令解码为已解码指令,所述已解码指令用于执行一个或多个机器学习操作,其中,所述解码单元用于基于所述一个或多个机器学习操作的参数来请求调度器将所述一个或多个机器学习操作调度给可编程计算单元阵列和固定功能计算单元中的一个。2.如权利要求1所述的计算设备,其中,所述解码单元包括用于获取所述单指令的获取逻辑。3.如权利要求2所述的计算设备,其中,所述单指令是机器学习计算指令。4.如权利要求3所述的计算设备,其中,所述机器学习计算指令是卷积指令,并且所述一个或多个机器学习操作包括卷积运算。5.如权利要求4所述的计算设备,其中,所述卷积运算包括多次矩阵运算。6.如权利要求5所述的计算设备,其中,所述解码单元用于基于卷积滤波器的大小来请求所述调度器将所述多次矩阵运算调度给所述可编程计算单元阵列和所述固定功能计算单元中的一个。7.如权利要求6所述的计算设备,其中,所述解码单元用于请求所述调度器将所述多次矩阵运算调度给所述固定功能计算单元以用于进行5×5或7×7卷积运算。8.如权利要求6所述的计算设备,其中,所述解码单元用于请求所述调度器将所述多次矩阵运算调度给所述可编程计算单元阵列以用于进行3×3或1×1卷积运算。9.如权利要求1所述的计算设备,其中,所述固定功能计算单元是包括固定功能计算逻辑阵列的脉动阵列矩阵运算单元。10.如权利要求9所述的计算设备,其中,所述固定功能计算逻辑阵列包括乘法累加计算逻辑。11.一种执行机器学习操作的方法,所述方法包括:获取和解码第一指令,所述第一指令指定要经由数据处理系统来执行的一组多个操作,所述一组多个操作中的至少一部分经由所述数据处理系统的通用图形处理单元来执行;分析与所述第一指令相关联的参数;对所述数据处理系统的所述通用图形处理单元的硬件资源利用率进行采样;以及选择一组指令以实现所述一组多个操作。12.如权利要求11所述的方法,其中,所述第一指令是用于执行人工神经网络的卷积运算的卷积指令,并且所述一组指令是卷积实现方式。13...
【专利技术属性】
技术研发人员:R·巴瑞克,E·乌尔德阿迈德瓦尔,陈晓明,D·斯里瓦斯塔瓦,姚安邦,K·尼利斯,E·努维塔蒂,S·S·巴格索克希,B·韦布,T·史佩斯曼,P·T·唐,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。