【技术实现步骤摘要】
改进AI引擎MAC利用率的数据格式变换方法
本专利技术涉及人工智能领域,尤其涉及一种改进人工智能引擎的MAC利用率的数据格式变换方法。
技术介绍
具有乘积累加运算(multiplyandaccumulate,MAC)处理元件(processingelement,PE)的脉动阵列的人工智能(artificialintelligence,AI)引擎用于图像处理、图像识别和其他计算任务。通常,图像数据通过3个通道输入到脉动阵列中,每个通道各自用于红色、绿色和蓝色(RGB)。脉动阵列可以用于实现神经网络,也称为人工神经网络(artificialneuralnetwork,ANN)。持续需要改进脉动阵列、AI引擎和神经网络的效率和操作。
技术实现思路
在第一方面中,提供一种人工智能引擎,包括:数据格式转换器,用于将与每个像素的颜色数量相对应的第一数量的通道中具有像素高度和像素宽度的输入图像的数据重新布置到第二数量的通道,其中第二数量的通道多于第一数量的通道,第二数量的通道中的每个具有较小的像素高度、较小的像 ...
【技术保护点】
1.一种人工智能AI引擎,包括:/n数据格式转换器,用于将与每个像素的颜色数量相对应的第一数量的通道中具有像素高度和像素宽度的输入图像的数据重新布置到第二数量的通道,其中第二数量的通道多于第一数量的通道,第二数量的通道中的每个具有较小的像素高度、较小的像素宽度和颜色中的一种的数据;以及/n在一侧具有N个乘积累加运算处理元件MAC PE的M×N个MAC PE的脉动阵列,用于接收和处理第二数量的通道的数据,使得与将第一数量的通道的数据输入到脉动阵列相比,在脉动阵列中的第一卷积层推理和第二卷积层推理中利用更多的MAC PE。/n
【技术特征摘要】
20191122 US 16/692,8481.一种人工智能AI引擎,包括:
数据格式转换器,用于将与每个像素的颜色数量相对应的第一数量的通道中具有像素高度和像素宽度的输入图像的数据重新布置到第二数量的通道,其中第二数量的通道多于第一数量的通道,第二数量的通道中的每个具有较小的像素高度、较小的像素宽度和颜色中的一种的数据;以及
在一侧具有N个乘积累加运算处理元件MACPE的M×N个MACPE的脉动阵列,用于接收和处理第二数量的通道的数据,使得与将第一数量的通道的数据输入到脉动阵列相比,在脉动阵列中的第一卷积层推理和第二卷积层推理中利用更多的MACPE。
2.根据权利要求1所述的AI引擎,其中第一数量的通道是分别与红色、绿色和蓝色通道相关联的3个通道,并且其中第二数量的通道是12个,通过将红色、绿色和蓝色通道中的每个通道中输入图像的多个4像素×4像素组中的每个布置为红色、绿色和蓝色中的每种颜色的4个2像素×2像素组而获得,其中每种颜色的4个2像素×2像素组中的每个呈现在总共12个通道的对应通道中。
3.根据权利要求1所述的AI引擎,其中:
M和N各自为64;
第一数量的通道是分别与红色、绿色和蓝色通道相关联的3个通道;以及
第二数量的通道是48个,通过将红色、绿色和蓝色通道中的每个通道中的输入图像的多个8像素×8像素组中的每个布置为红色、绿色和蓝色中的每种颜色的16个2像素×2像素组而获得,其中每种颜色的16个2像素×2像素组中的每个呈现在总共48个通道的对应通道中。
4.根据权利要求1所述的AI引擎,其中数据格式转换器在数字信号处理器DSP中实现。
5.根据权利要求1所述的AI引擎,其中数据格式转换器在精简指令集计算机RISC中实现。
6.根据权利要求1所述的AI引擎,还包括:
神经网络核心,具有实现为N×NMACPE阵列的M×N个MACPE的脉动阵列以及耦接到N×NMACPE阵列的输出侧的累加器,其中数据格式转换器被实现为耦接到N×NMACPE阵列的输入侧的数据变换模块;
耦接到累加器的输出的缩放模块;
耦接到缩放模块的输出的激活模块;以及
耦接到激活模块的输出的池化模块。
7.根据权利要求1所述的AI引擎,其中第二数量的通道中的每个通道包括多个像素对,每个像素对包括在通道中相邻但在图像中不相邻的第一像素和第二像素。
8.一种操作人工智能AI引擎的方法,包括:
将与每个像素的颜色数量相对应的第一数量的通道中具有像素高度和像素宽度的...
【专利技术属性】
技术研发人员:郭敏,
申请(专利权)人:百度美国有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。