一种面向深度学习的处理器模组制造技术

技术编号：30762079 阅读：16 留言：0更新日期：2021-11-10 12:16

本发明专利技术提供一种面向深度学习的处理器模组，包括多核CPU模块、深度学习加速引擎阵列、通信模块以及存储模块。其中，多核CPU模块包括若干个并行分布的CPU；深度学习加速引擎阵列包括若干个与CPU可通信地连接的深度学习单元；通信模块包括若干个通信接口，任一通信接口的一端与多核CPU模块和/或深度学习加速引擎阵列可通信地连接；以及存储模块与多核CPU模块和/或深度学习加速引擎阵列可通信地连接。接。接。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向深度学习的处理器模组

[0001]本专利技术涉及深度学习
，特别涉及一种面向深度学习的处理器模组。

技术介绍

[0002]深度学习属于机器学习研究中的一个领域，其主要目的在于建立、模拟人脑进行分析学习的神经网络，通过模仿人脑的机制来解释数据，例如图像，声音和文本。深度机器学习方法包括监督学习与无监督学习，不同的学习框架下建立的学习模型不同。例如，卷积神经网络(Convolutional neural networks，简称CNNs)就是一种深度的监督学习下的机器学习模型，而深度置信网(Deep Belief Nets，简称DBNs)就是一种无监督学习下的机器学习模型。
[0003]基于服务器运行深度学习模型应用非常常见，例如图像识别、信号识别、网络分类等。由于深度学习模型运行本身需要极高的算力，将模型部署于服务器，通过本地网络或者互联网传输模型输入及输出结果是一种常见的应用场景。因此，会有一大部分深度学习模型会以部署在服务器的方式向市场提供人工智能方面的服务。
[0004]由于相较于CPU(Central Processing Unit，中央处理器)而言，GPU(Graphics Processing Unit，图像处理器)具有更强的浮点数运算能力，因此，深度学习通常采用GPU服务器实现。目前，常见的GPU服务器结构如图1所示，采用基于标准的外扩式服务器结构。所述GPU服务器包括多个CPU以及GPU，其中，通用性的计算任务由CPU完成，高度并行的深度学习计算任务由GPU完成，形成异构计算...

【技术保护点】

【技术特征摘要】
1.一种面向深度学习的处理器模组，其特征在于，包括：多核CPU模块，包括若干个并行分布的CPU；深度学习加速引擎阵列，包括若干个深度学习单元，所述深度学习单元与所述多核CPU模块可通信地连接；通信模块，包括若干个通信接口，任一所述通信接口的一端与所述多核CPU模块和/或深度学习加速引擎阵列可通信地连接；存储模块，与所述多核CPU模块和/或深度学习加速引擎阵列可通信地连接。2.如权利要求1所述的处理器模组，其特征在于，所述CPU采用RISC指令集架构。3.如权利要求1所述的处理器模组，其特征在于，所述深度学习单元采用特定领域架构方式搭建形成。4.如权利要求1所述的处理器模组，其特征在于，所述通信接口包括...

【专利技术属性】
技术研发人员：张震宁，陈亮，
申请(专利权)人：上海熠知电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人