用于卷积神经网络的数据加载方法和装置制造方法及图纸

技术编号:21479329 阅读:38 留言:0更新日期:2019-06-29 05:11
本申请实施例公开了用于卷积神经网络的数据加载方法和装置。上述方法的一具体实施方式包括:获取卷积神经网络中数据处理层的数据获取顺序信息;根据数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据;对所获取的数据进行整理;将整理后的数据存储在存储器阵列中,以供与存储器阵列连接的乘加器阵列加载整理后的数据。该实施方式可以有效地提高卷积神经网络的数据加载速度,提高卷积神经网络的计算性能。

【技术实现步骤摘要】
用于卷积神经网络的数据加载方法和装置
本申请实施例涉及计算机
,具体涉及用于卷积神经网络的数据加载方法和装置。
技术介绍
随着人工智能的爆发式增长,深度学习已经成为当前从大量数据分析提取有价值信息的有效手段。而卷积神经网络由于其权值的可重用性而受到关注。通过卷积神经网络的不同模型,可以对诸多现实生活中的物体进行检测、分类,从而能够在特定领域应用。卷积神经网络对输入的信息进行检测和分类的过程,通常需要大量的数据计算,消耗巨大的计算资源和时间。因此,硬件所能提供的计算能力成为卷积神经网络性能的瓶颈。
技术实现思路
本申请实施例提出了用于卷积神经网络的数据加载方法和装置。第一方面,本申请实施例提供了一种用于卷积神经网络的数据加载方法,包括:获取卷积神经网络中数据处理层的数据获取顺序信息;根据上述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据;对所获取的数据进行整理;将整理后的数据存储在存储器阵列中,以供与上述存储器阵列连接的乘加器阵列加载整理后的数据。在一些实施例中,所获取的数据中包括数据处理层标识;以及上述对所获取的数据进行整理,包括:确定与上述数据处理层标识对应的数据整理信息;根据所确定的数据整理信息,对所获取的数据进行整理。在一些实施例中,上述对所获取的数据进行整理,包括:确定与上述数据处理层标识对应的权重参数;根据上述数据整理信息,对上述数据以及上述权重参数进行整理。在一些实施例中,上述根据上述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据,包括:确定上述乘加器阵列在单次计算过程中能够处理的数据的最大容量;确定所需输入数据处理层的数据的实际容量;响应于确定上述实际容量大于上述最大容量,根据上述最大容量,分批从内存中获取用于输入数据处理层的数据。在一些实施例中,上述方法还包括:响应于接收到上述乘加器阵列发送的、针对上述存储器阵列中存储的数据的读取请求,确定上述乘加器阵列对上述数据的读取顺序信息;根据上述读取顺序信息,对存储器阵列中存储的数据进行整理以及将整理后的数据输入上述乘加器阵列。第二方面,本申请实施例提供了一种现场可编程门阵列,包括:控制模块以及存储器阵列;上述控制模块被配置成:获取卷积神经网络中数据处理层的数据获取顺序信息;根据上述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据;对所获取的数据进行整理;将整理后的数据存储在存储器阵列中,以供与上述存储器阵列连接的乘加器阵列加载整理后的数据。在一些实施例中,所获取的数据中包括数据处理层标识;以及上述控制模块进一步被配置成:确定与上述数据处理层标识对应的数据整理信息;根据所确定的数据整理信息,对所获取的数据进行整理。在一些实施例中,上述控制模块进一步被配置成:确定与上述数据处理层标识对应的权重参数;根据上述数据整理信息,对上述数据以及上述权重参数进行整理。在一些实施例中,上述控制模块进一步被配置成:确定上述乘加器阵列在单次计算过程中能够处理的数据的最大容量;确定所需输入数据处理层的数据的实际容量;响应于确定上述实际容量大于上述最大容量,根据上述最大容量,分批从内存中获取用于输入数据处理层的数据。在一些实施例中,上述控制模块进一步被配置成:响应于接收到上述乘加器阵列发送的、针对上述存储器阵列中存储的数据的读取请求,确定上述乘加器阵列对上述数据的读取顺序信息;根据上述读取顺序信息,对存储器阵列中存储的数据进行整理以及将整理后的数据输入上述乘加器阵列。第三方面,本申请实施例提供了一种用于卷积神经网络的数据加载装置,包括:信息获取单元,被配置成获取卷积神经网络中数据处理层的数据获取顺序信息;数据获取单元,被配置成根据上述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据;第一数据整理单元,被配置成对所获取的数据进行整理;数据存储单元,被配置成将整理后的数据存储在存储器阵列中,以供与上述存储器阵列连接的乘加器阵列加载整理后的数据。第四方面,本申请实施例提供了一种电子设备,包括:内存;一个或多个如第二方面实施例所描述的现场可编程门阵列。第五方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一实施例所描述的方法。本申请的上述实施例提供的用于卷积神经网络的数据加载方法和装置,首先可以获取卷积神经网络中数据处理层的数据获取顺序信息。然后,可以根据数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据。并对所获取的数据进行整理。最后,将整理后的数据存储在存储器阵列中,以供与存储器阵列连接的乘加器阵列能够加载整理后的数据。本实施例的方法,可以有效地提高卷积神经网络的数据加载速度,提高卷积神经网络的计算性能。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于卷积神经网络的数据加载方法的一个实施例的流程图;图3是根据本申请的用于卷积神经网络的数据加载方法的一个应用场景的示意图;图4是根据本申请的用于卷积神经网络的数据加载方法的又一个实施例的流程图;图5是根据本申请的现场可编程门阵列的一个实施例的结构示意图;图6是根据本申请的现场可编程门阵列的一个实施例的结构示意图;图7是根据本申请的用于卷积神经网络的数据加载装置的一个实施例的结构示意图;图8是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于卷积神经网络的数据加载方法或用于卷积神经网络的数据加载装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括CPU101、内存102、总线103和现场可编程门阵列(Field-ProgrammableGateArray,FPGA)104。总线103用以在CPU101和FPGA104之间提供通信链路的介质。上述总线103可以为PCIE(PeripheralComponentInterconnectExpress,一种高速串行计算机扩展总线标准)总线等。CPU101可以通过总线103与FPGA104进行交互,以发送和接收消息。CPU101可以将内存102中存储的、用于输入卷积神经网络中数据处理层的数据通过总线103发送到FPGA104,同时也可以接收FPGA14返回的处理结果。FPGA104也可以通过总线直接从内存102中获取数据。FPGA104是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。FPGA104可以用于处理卷积神经网络中大量计算密集型的计算任务。FPGA104可以包括控制模块和存储器阵列(MemoryArray,MA),控制模块与MA通信,既可以向MA中存储数据,又可以本文档来自技高网...

【技术保护点】
1.一种用于卷积神经网络的数据加载方法,包括:获取卷积神经网络中数据处理层的数据获取顺序信息;根据所述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据;对所获取的数据进行整理;将整理后的数据存储在存储器阵列中,以供与所述存储器阵列连接的乘加器阵列加载整理后的数据。

【技术特征摘要】
1.一种用于卷积神经网络的数据加载方法,包括:获取卷积神经网络中数据处理层的数据获取顺序信息;根据所述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据;对所获取的数据进行整理;将整理后的数据存储在存储器阵列中,以供与所述存储器阵列连接的乘加器阵列加载整理后的数据。2.根据权利要求1所述的方法,其中,所获取的数据中包括数据处理层标识;以及所述对所获取的数据进行整理,包括:确定与所述数据处理层标识对应的数据整理信息;根据所确定的数据整理信息,对所获取的数据进行整理。3.根据权利要求2所述的方法,其中,所述对所获取的数据进行整理,包括:确定与所述数据处理层标识对应的权重参数;根据所述数据整理信息,对所述数据以及所述权重参数进行整理。4.根据权利要求1所述的方法,其中,所述根据所述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据,包括:确定所述乘加器阵列在单次计算过程中处理的数据的最大容量;确定所需输入数据处理层的数据的实际容量;响应于确定所述实际容量大于所述最大容量,根据所述最大容量,分批从内存中获取用于输入数据处理层的数据。5.根据权利要求1所述的方法,其中,所述方法还包括:响应于接收到所述乘加器阵列发送的、针对所述存储器阵列中存储的数据的读取请求,确定所述乘加器阵列对所述数据的读取顺序信息;根据所述读取顺序信息,对存储器阵列中存储的数据进行整理以及将整理后的数据输入所述乘加器阵列。6.一种现场可编程门阵列,包括:控制模块以及存储器阵列;所述控制模块被配置成获取卷积神经网络中数据处理层的数据获取顺序信息;根据所述数据获取顺序信息,依次从内存中获取用于输入数据处理层的数据;对所获取的数据进行整理;将整理后的数据存储在存储器阵列中,以供与所述存储器阵列连接的乘加器阵列加载整理后的数据...

【专利技术属性】
技术研发人员:周中良吴体龙
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1