The aim of this application is one kind of neural network data processing method and apparatus based on the method including: single precision floating-point type data of the neural network for precision conversion; calculation of low precision floating-point type data after the conversion precision formed by neural network. Compared with the prior art, the neural network data processing method and device based on the application provides the use, reduce the accuracy of the way to solve the problem of large amount of storage, the model can save memory space, so that the same hardware configuration can run more model; can save data in memory or disk space occupied; when deployed in the model cluster, can effectively reduce the need of synchronization network bandwidth, effectively reduce the communication overhead and improve the overall performance.
【技术实现步骤摘要】
本申请涉及计算机领域,尤其涉及一种基于神经网络的数据处理方法和装置。
技术介绍
随着计算机技术的不断更新换代,神经网络在模拟人类智能方面取得了长足进展。经过近几十年发展,目前神经网络向着更大的模型、更大的数据集方向发展,利用更大的模型和更大的数据集可以得到更高的分类、检测准确率,但带来问题是计算量、存储量的大幅增加。计算量大的问题可以通过多核CPU、GPU等高性能硬件解决,利用更大的内存容量、更大的硬盘容量、更快的网络硬件,满足日益增长的神经网络参数、数据集,但面临升级周期长、稳定性差、设备投资过大等问题。而目前阶段,神经网络学术界还没有大幅减少神经网络计算量和参数量的突破性进展。工业界目前常用的神经网络框架如Caffe、Convnet2等采用了多核CPU、GPU对计算进行加速,当模型太大或数据量太大时,将算法分布在一个集群的多台计算设备上同时进行(分别称为模型并行、数据并行),但计算节点之间同步参数、数据所需的网络带宽也是巨大的。为此,亟需研究一种降低神经网络参数、数据大小的方法。
技术实现思路
本申请的一个目的是提供一种基于神经网络的数据处理方法和装置,以解决实现神经网络时,在不影响算法效果的情况下减少算法对存储空间的需求的问题。根据本申请的一个方面,提供了一种基于神经网络的数据处理方法,其中,所述方法包括:将神经网络的单精度浮点类型数据进行精度转换;对经过所述精度转换形成的低精度浮点类型数据进行神经网络计算。根据本申请的另一个方面,提供了一种基于神经网络的数据处理装置,其中,所述装置包括:精度转换模块,用于将神经网络的单精度浮点类型数据 ...
【技术保护点】
一种基于神经网络的数据处理方法,其中,所述方法包括:将神经网络的单精度浮点类型数据进行精度转换;对经过所述精度转换形成的低精度浮点类型数据进行神经网络计算。
【技术特征摘要】
1.一种基于神经网络的数据处理方法,其中,所述方法包括:将神经网络的单精度浮点类型数据进行精度转换;对经过所述精度转换形成的低精度浮点类型数据进行神经网络计算。2.根据权利要求1所述的方法,其中,所述低精度浮点类型数据的指数项小于所述单精度浮点类型数据的指数项,或,所述低精度浮点类型数据的尾数项小于所述单精度浮点类型数据的尾数项。3.根据权利要求2所述的方法,其中,所述精度转换包括:对所述单精度浮点类型数据进行最大值估算;设定量化噪声功率;根据所述最大值估算的结果和所述量化噪声功率设定所述指数项位宽和所述尾数项位宽;根据设定的所述指数项位宽和所述尾数项位宽对所述单精度浮点类型数据进行数据类型转换。4.根据权利要求1所述的方法,其中,所述方法还包括网络初始化;所述网络初始化包括:根据所述低精度浮点类型数据分配所述神经网络的所需存储空间。5.根据权利要求4所述的方法,其中,所述网络初始化还包括:获取网络权值并对所述网络权值进行精度转换。6.根据权利要求1至5中任一项所述的方法,其中,所述神经网络计算包括:将所述低精度浮点类型数据输入卷积层进行卷积运算;将卷积运算的结果输入最大池化层进行池化处理;将池化处理的结果输入局部对比归一化层进行动态范围压缩;将动态范围压缩的结果输入全连接层进行输出关联。7.根据权利要求6所述的方法,其中,所述神经网络计算还包括:将动态范围压缩的结果返回卷积层进行循环处理。8.根据权利要求6或7所述的方法,其中,所述神经网络计算还包括:调取计算库的计算函数进行神经网络计算;其中,所述计算库包括:所述低精度浮点类型数据与所述低精度浮点类型数据之间的计算函数、所
\t述低精度浮点类型数据与所述单精度浮点类型数据之间的计算函数、所述低精度浮点类型数据与双精度浮点类型数据之间的计算函数。9.一种基于神经网络的数据处理装置,其中,所述装置包括:精度转换模块,用于将神经网络的单精度浮点类型数据进行精度转换;神经网络计算模块,用于对经过所述...
【专利技术属性】
技术研发人员:赵永科,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。