深度学习系统构建方法、装置、深度学习系统及存储介质制造方法及图纸

技术编号:18526736 阅读:57 留言:0更新日期:2018-07-25 13:05
本发明专利技术公开了一种深度学习系统构建方法、装置、深度学习系统及存储介质,所述深度学习系统构建方法包括:获取目标算法的计算需求,基于所述计算需求,确定待使用芯片组;根据待使用芯片组包含的待使用芯片的数量,对所述目标算法进行划分,得到若干子算法;获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器。通过本发明专利技术,实现了根据目标算法的计算需求、带宽需求,灵活配置深度学习系统,降低了硬件成本与运行成本。

【技术实现步骤摘要】
深度学习系统构建方法、装置、深度学习系统及存储介质
本专利技术涉及深度学习领域,尤其涉及深度学习系统构建方法、装置、深度学习系统及存储介质。
技术介绍
深度学习的概念源于人工神经网络的研究。深度学习的提出使得人工神经网络重新成为机器学习最重要的算法之一,在传统的人工神经网络训练中增加了一个预训练阶段,即用无监督学习对每一层网络进行一次专门的训练,然后才用有监督学习对整个网络进行总体训练,也就是说计算机通过深度神经网络,模拟人脑的机制来学习、判断、决策。通过深度学习方法,人工神经网络的效果一举赶上甚至显著超过了支持向量机等其他机器学习方法。近年来,这种方法已被应用于许多领域,在IBM、谷歌、微软、科大讯飞、百度等公司很多工业级图像和语音处理应用上取得了非常好的效果,在近期和未来都将是人工智能领域的一个热点研究方向。深度学习中涉及的算法需要基于深度学习系统实现。现有技术中,深度学习系统由大量的中央处理器(CPU)及图形处理器(GPU)堆积而成,这样的深度学习系统,成本高且运行能耗高。
技术实现思路
本专利技术的主要目的在于提供一种深度学习系统构建方法、装置、深度学习系统及存储介质,旨在解决现有技术中深度学习系统成本高、运行能耗高的技术问题。为实现上述目的,本专利技术提供一种深度学习系统构建方法,所述深度学习系统构建方法包括:获取目标算法的计算需求,基于所述计算需求,确定待使用芯片组;根据待使用芯片组包含的待使用芯片的数量,对所述目标算法进行划分,得到若干子算法;获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器。优选地,所述获取目标算法的计算需求包括:获取目标算法的算法标识,根据所述算法标识,获取所述目标算法的计算需求。优选地,所述基于所述计算需求,确定待使用芯片组包括:获取预置芯片的计算能力,根据计算需求与所述计算能力,计算得到预置芯片的所需数量;根据所述预置芯片的所需数量,确定待使用芯片组,其中,所述待使用芯片组的整体计算能力大于所述计算需求。优选地,所述获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器包括:获取各个子算法的带宽需求,获取各个子算法与各个待使用芯片的对应关系;根据各个子算法的带宽需求,以及各个子算法与各个待使用芯片的对应关系,确定各个待使用芯片对应的待使用存储器。优选地,所述获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器之后包括:基于所述待使用芯片组以及所述各个待使用芯片对应的待使用存储器,生成构建信息;输出所述构建信息。此外,为实现上述目的,本专利技术还提供一种基于上述所述的深度学习系统构建方法构建的深度学习系统,所述深度学习系统包括:多个通过数据接口串联的所述待使用芯片,各个待使用芯片连接有对应的待使用存储器。此外,为实现上述目的,本专利技术还提供一种深度学习系统构建装置,所述深度学习系统构建装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的深度学习系统构建程序,所述深度学习系统构建程序被所述处理器执行时实现如上所述的深度学习系统构建方法的步骤。此外,为实现上述目的,本专利技术还提供一种存储介质,所述存储介质上存储有深度学习系统构建程序,所述深度学习系统构建程序被处理器执行时实现如上所述的深度学习系统构建方法的步骤。本专利技术中,获取目标算法的计算需求,基于计算需求,确定待使用芯片组,根据待使用芯片组包含的待使用芯片的数量,对所述目标算法进行划分,得到若干子算法,获取各个子算法的带宽需求,根据各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器。通过本专利技术,可根据目标算法的计算需求,确定待使用芯片组,从而根据待使用芯片组包含的待使用芯片数量,将目标算法划分成若干个子算法,再进一步根据每个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器。通过确定的待使用芯片以及待使用芯片对应的待使用存储器,即可构建出满足目标算法的计算需求的深度学习系统,实现了根据目标算法的计算需求、带宽需求,灵活配置深度学习系统,降低了硬件成本与运行成本。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的装置结构示意图;图2为本专利技术深度学习系统构建方法第一实施例的流程示意图;图3为本专利技术深度学习系统建立方法一实施例中FPGA板卡的结构示意图;图4为本专利技术深度学习系统建立方法一实施例中基于构建信息得到的深度学习系统的场景示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的装置结构示意图。本专利技术实施例装置可以是PC,也可以是智能手机、平板电脑、便携计算机等终端设备。如图1所示,该装置可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及深度学习系统构建程序。在图1所示的装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的深度学习系统构建程序,并执行以下操作:获取目标算法的计算需求,基于所述计算需求,确定待使用芯片组;根据待使用芯片组包含的待使用芯片的数量,对所述目标算法进行划分,得到若干子算法;获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器。进一步地,所述获取目标算法的计算需求包括:获取目标算法的算法标识,根据所述算法标识,获取所述目标算法的计算需求。进一步地,所述基于所述计算需求,确定待使用芯片组包括:获取预置芯片的计算能力,根据计算需求与所述计算能力,计算得到预置芯片的所需数量;根据所述预置芯片的所需数量,确定待使用芯片组,其中,所述待使用芯片组的整体计算能力大于所述计算需求。进一步地,所述获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器包括:获取各个子算法的带宽需求,获取各个子算法与各个待使用芯片的对应关系;根据各个子算法的带宽需求,以及各个子算法与各个待使用芯片的对应关系,确定各个待使用芯片对应的待使用存储器。进一步地,所述获取各个子算法的带宽需求,根据所本文档来自技高网...

【技术保护点】
1.一种深度学习系统构建方法,其特征在于,所述深度学习系统构建方法包括:获取目标算法的计算需求,基于所述计算需求,确定待使用芯片组;根据待使用芯片组包含的待使用芯片的数量,对所述目标算法进行划分,得到若干子算法;获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器。

【技术特征摘要】
1.一种深度学习系统构建方法,其特征在于,所述深度学习系统构建方法包括:获取目标算法的计算需求,基于所述计算需求,确定待使用芯片组;根据待使用芯片组包含的待使用芯片的数量,对所述目标算法进行划分,得到若干子算法;获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器。2.如权利要求1所述的深度学习系统构建方法,其特征在于,所述获取目标算法的计算需求包括:获取目标算法的算法标识,根据所述算法标识,获取所述目标算法的计算需求。3.如权利要求1所述的深度学习系统构建方法,其特征在于,所述基于所述计算需求,确定待使用芯片组包括:获取预置芯片的计算能力,根据计算需求与所述计算能力,计算得到预置芯片的所需数量;根据所述预置芯片的所需数量,确定待使用芯片组,其中,所述待使用芯片组的整体计算能力大于所述计算需求。4.如权利要求1所述的深度学习系统构建方法,其特征在于,所述获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器包括:获取各个子算法的带宽需求,获取各个子算法与各个待使用芯片的对应关系;根据各个子算法的带宽需求,以及各个子算法与各个待使用芯片的对应关系,确定各个待使用芯片对应的待使用存储器。5.如权利要求1所述的深度学习系统构建方法,其特征在于,所述获取各个子算法的带宽需求,根据所述各个子算法的带宽需求,确定各个待使用芯片对应的待使用存储器之后包括:基于所述待使用芯片组以及所述各个待使用芯片对应的待使用存储器,生成构建信息;输出所述构建信息。6.一种基于权利1至5中任...

【专利技术属性】
技术研发人员:刘新宋朝忠郭烽单单杨伟
申请(专利权)人:深圳市易成自动驾驶技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1