【技术实现步骤摘要】
处理装置和用于信息处理的方法
本公开的实施例概括地涉及数据处理领域和深度学习领域,并且更具体地,涉及人工智能领域。
技术介绍
近年来随着人工智能领域硬件和软件的不断提升,深度学习技术得到了飞速发展。深度学习技术可以运用在各个领域,比如计算机视觉、自然语言处理、音频分析等。卷积神经网络(CNN)是深度学习技术中具有影响力的网络模型,特别适合于涉及图像、语音、文本数据的应用。卷积神经网络所涉及的计算主要包括卷积计算、激活计算、池化计算、全连接(FC)计算、柔性最大值(SoftMax)计算等,其中卷积计算的计算量和功耗最为巨大。在卷积神经网络的训练过程中,为实现模型优化,在利用训练数据执行前向计算外,还会利用后向传播方式实现模型的参数优化。在卷积神经网络的使用过程中涉及卷积层的大量分组操作和卷积操作。在一些卷积神经网络架构中,分组操作和卷积操作可能占据整个架构运算的大多数计算资源和时间。因此,期望处理器能够更快速、高效地处理分组操作和/或卷积操作,这将有助于加速整个深度学习网络、特别是卷积神经网络的使用和训练。r>
技术实现思路
...
【技术保护点】
1.一种处理装置,包括:/n至少一个通用处理核心,被配置为生成卷积神经网络中的卷积层的中间计算结果;/n至少一个深度学习专用处理核心,被配置为基于所述至少一个通用处理核心的所述中间计算结果,执行所述卷积神经网络中除卷积层以外的其他层的计算;和/n存储管理装置,分别与所述至少一个通用处理核心和所述至少一个深度学习专用处理核心连接,并且被配置为存储所述至少一个通用处理核心的所述中间计算结果,以实现所述至少一个通用处理核心和所述至少一个深度学习专用处理核心之间的数据交互。/n
【技术特征摘要】
1.一种处理装置,包括:
至少一个通用处理核心,被配置为生成卷积神经网络中的卷积层的中间计算结果;
至少一个深度学习专用处理核心,被配置为基于所述至少一个通用处理核心的所述中间计算结果,执行所述卷积神经网络中除卷积层以外的其他层的计算;和
存储管理装置,分别与所述至少一个通用处理核心和所述至少一个深度学习专用处理核心连接,并且被配置为存储所述至少一个通用处理核心的所述中间计算结果,以实现所述至少一个通用处理核心和所述至少一个深度学习专用处理核心之间的数据交互。
2.根据权利要求1所述的处理装置,其中所述存储管理装置包括:
存储阵列单元;
读写控制单元,被配置为执行所述至少一个通用处理核心和所述至少一个深度学习专用处理核心对所述存储阵列单元中的数据的读写操作;和
存储分配交换单元,被配置为将所述存储阵列单元中的数据发送给相应的通用处理核心和深度学习专用处理核心,以实现所述通用处理核心之间和/或所述通用处理核心与所述深度学习专用处理核心之间的数据交换。
3.根据权利要求1或2所述的处理装置,还包括:
语音模块,被配置为将所接收的语音信号转换成语音数据;
存储器,被配置为存储所接收到的语音数据;和
控制器,被配置为根据预先定义的程序向所述至少一个通用处理核心和所述至少一个深度学习专用处理核心分配计算任务,并且控制所述存储器将所述语音数据传输到所述存储管理装置。
4.根据权利要求1或2所述的处理装置,其中所述通用处理核心包括并行的多个通用处理核心,所述多个通用处理核心被配置为并行地执行所述卷积神经网络中的卷积层的计算。
5.根据权利要求1或2所述的处理装置,其中所述至少一个深度学习专用处理核心被配置为执行所述卷积神经网络中的以下层中的至少一个层的计算:激活层;池化层;长短期记忆层;全连接层;柔性最大值层。
6.根据权利要求1或2所述的处理装置,其中所述至少一个通用处理核心是数字信号处理器DSP,并且所述至少一个深度学习专用处理核心是神经网络处理器NPU。
7.根据权利要求1或2所述的处理装置,...
【专利技术属性】
技术研发人员:严小平,田超,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。