一种对用于图片识别的卷积神经网络训练的方法与设备技术

技术编号：13917512 阅读：91 留言：0更新日期：2016-10-27 15:48

本申请的目的是提供一种对用于图片识别的卷积神经网络进行训练的方法与设备。具体地，根据用于图片识别的卷积神经网络的参数信息初始化同一GPU上所述卷积神经网络的多个网络；将所述卷积神经网络所对应的训练图片数据分配至所述多个网络；对所述多个网络按所分配的所述训练图片数据进行并行训练处理；根据所述网络经训练处理后的误差信息更新所述卷积神经网络的参数信息。与现有技术相比，本申请通过使用同一套参数信息初始化同一GPU上卷积神经网络的多个网络，将训练图片数据分配至所述多个网络进行并行训练处理，用所得误差信息更新所述参数信息，从而提高GPU单卡计算效率，减少计算资源浪费，提升卷积神经网络对图片的识别效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机领域，尤其涉及一种对用于图片识别的卷积神经网络训练的技术。
技术介绍
随着互联网高速发展，网络中图片数据量激增，针对图片数据的处理技术迅速发展并日益完善，其中，卷积神经网络这样的深度学习算法被广泛应用于图片识别中，并在降低网络模型复杂度、提升图片数据处理能力等方面取得了显著的成效。为了提升图片识别中数据的处理效率，目前对于基于GPU进行图片识别学习训练的卷积神经网络多采用单机多GPU或多机多GPU的方式，其中，GPU(Graphics Processing Unit)又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。然而，对于每一块GPU而言，其性能并没有被充分利用，从而造成计算资源的严重浪费。
技术实现思路
本申请的目的是提供一种对用于图片识别的卷积神经网络训练的方法与设备，用以解决基于GPU对用于图片识别的卷积神经网络训练效率低下造成资源浪费的问题。根据本申请的一个方面，提供了一种对用于图片识别的卷积神经网络训练的方法，该方法解决了基于GPU对用于图片识别的卷积神经网络训练效率低下造成资源浪费的问题，其中该方法包括：根据用于图片识别的卷积神经网络的参数信息初始化同一GPU上所述卷积神经网络的多个网络；将所述卷积神经网络所对应的训练图片数据分配至所述多个网络；对所述多个网络按所分配的所述训练图片数据进行并行训练处理；根据所述网络经训练处理后的误差信息更新所述卷积神经网络的参数信息。根据本申请的另一方面，还提供了一种提供了一种对用于图片识别的卷积神经网络训...

【技术保护点】
一种对用于图片识别的卷积神经网络进行训练的方法，包括：根据用于图片识别的卷积神经网络的参数信息初始化同一GPU上所述卷积神经网络的多个网络；将所述卷积神经网络所对应的训练图片数据分配至所述多个网络；对所述多个网络按所分配的所述训练图片数据进行并行训练处理；根据所述网络经训练处理后的误差信息更新所述卷积神经网络的参数信息。

【技术特征摘要】
2015.04.03 CN 20151015843911.一种对用于图片识别的卷积神经网络进行训练的方法，包括：根据用于图片识别的卷积神经网络的参数信息初始化同一GPU上所述卷积神经网络的多个网络；将所述卷积神经网络所对应的训练图片数据分配至所述多个网络；对所述多个网络按所分配的所述训练图片数据进行并行训练处理；根据所述网络经训练处理后的误差信息更新所述卷积神经网络的参数信息。2.根据权利要求1所述的方法，其中，所述多个网络中每一个都独占所述GPU中的一个硬件队列；其中，所述将所述卷积神经网络所对应的训练图片数据分配至所述多个网络包括：将所述卷积神经网络所对应的训练图片数据经所述硬件队列分配至所述多个网络。3.根据权利要求1所述的方法，其中，所述将所述卷积神经网络所对应的训练图片数据分配至所述多个网络包括：将所述卷积神经网络所对应的训练图片数据按所述多个网络的数量分成多个训练图片子集；将每个训练图片子集传输至对应的所述网络。4.根据权利要求3所述的方法，其中，任两个所述训练图片子集中的图片数量的差值低于预定的图片分配阈值。5.根据权利要求1至4中任一项所述的方法，其中，所述网络包括多个计算层；其中，所述对所述多个网络按所分配的所述训练图片数据进行并行训练处理包括：对所述多个网络按所分配的所述训练图片数据进行并行训练处理，其中，所述多个网络的训练处理按所述计算层保持同步。6.根据权利要求5所述的方法，其中，所述对所述多个网络按所分配的所述训练图片数据进行并行训练处理还包括：在至少一个所述计算层中将所述多个网络的训练处理合并进行。7.根据权利要求5所述的方法，其中，所述根据所述网络经训练处理后的误差信息更新所述卷积神经网络的参数信息包括：根据所述网络在每一所述计算层中的误差信息，确定所述所述网络经训练处理后的误差信息；根据所述网络经训练处理后的误差信息更新所述卷积神经网络的参数信息。8.根据权利要求5所述的方法，其中，所述对所述多个网络按所分配的所述训练图片数据进行并行训练处理还包括：根据所述多个网络的训练处理过程中所述GPU的利用率，确定所述多个网络在下一个所述计算层中的训练处理方式。9.根据权利要求1所述的方法，其中，所述多个网络的数量信息与所述GPU所支持的独立工作流的数量相适应。10.根据权利要求1所述的方法，其中，所述训练图片数据中的图片满足单通道像素尺寸小于等于32*32。11.根据权利要求1所述的方法，其中，所述方法还包括：向对应参数服务器上传所述卷积...

【专利技术属性】
技术研发人员：王琤，贾喆，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人