【技术实现步骤摘要】
一种卷积神经网络的计算方法及系统
本专利技术涉及人工智能
,更具体地,涉及一种卷积神经网络的计算方法及系统。
技术介绍
和传统的机器学习方法相比,卷积神经网络可以更高效地处理复杂的识别问题,比如:计算机视觉,语义识别,自然语言处理以及其他识别任务。卷积神经网络(尤其是深度卷积神经网络)的结构复杂且参数众多,因此卷积神经网络的内部计算量非常大。尤其在卷积神经网络的训练阶段,由于一个高精度的卷积神经网络往往需要在大规模的数据集上进行训练,且每次训练均需要百万甚至千万次规模的计算迭代,因此需要大量的计算资源和运行时间。通用GPU是一种高效的卷积神经网络加速器,因此,目前设计和开发出了众多的卷积神经网络框架和加速库,比如:caffe,cuDNN,cuda-convnet2,Torch,Theano,fbfft等。然而,这些基于GPU的卷积神经网络实现并不能满足卷积神经网络的计算需求。首先,这些实现在性能上存在巨大的差异,没有一种实现可以最快地在所有场景下运行。这些性能差异主要是由于不同的卷积策略和GPU上的优化技巧。比 ...
【技术保护点】
1.一种卷积神经网络的计算方法,其特征在于,包括:/n获取目标卷积神经网络中所有卷积层对应的配置参数,对于任意一个卷积层,根据该卷积层对应的配置参数在知识库中查找该卷积层对应的最佳卷积策略组合;/n若所述知识库中不存在所述最佳卷积策略组合,则将该卷积层分解成多个卷积阶段,对于任意一个卷积阶段,获取该卷积阶段对应的多个候选卷积策略,从所有所述候选卷积策略中筛选出该卷积阶段对应的最佳卷积策略;/n将所有所述卷积阶段对应的最佳卷积策略进行组合,获得该卷积层对应的最佳卷积策略组合,以使得所述目标卷积神经网络中的所有卷积层根据各自对应的最佳卷积策略组合进行卷积计算。/n
【技术特征摘要】
1.一种卷积神经网络的计算方法,其特征在于,包括:
获取目标卷积神经网络中所有卷积层对应的配置参数,对于任意一个卷积层,根据该卷积层对应的配置参数在知识库中查找该卷积层对应的最佳卷积策略组合;
若所述知识库中不存在所述最佳卷积策略组合,则将该卷积层分解成多个卷积阶段,对于任意一个卷积阶段,获取该卷积阶段对应的多个候选卷积策略,从所有所述候选卷积策略中筛选出该卷积阶段对应的最佳卷积策略;
将所有所述卷积阶段对应的最佳卷积策略进行组合,获得该卷积层对应的最佳卷积策略组合,以使得所述目标卷积神经网络中的所有卷积层根据各自对应的最佳卷积策略组合进行卷积计算。
2.根据权利要求1所述的方法,其特征在于,所述根据该卷积层对应的配置参数在知识库中查找该卷积层对应的最佳卷积策略组合,之后还包括:
若所述知识库中存在所述最佳卷积策略组合,则从所述知识库中获取所述最佳卷积策略组合,以使得该卷积层根据所述最佳卷积策略组合进行卷积计算。
3.根据权利要求1所述的方法,其特征在于,所述获取该卷积阶段对应的多个候选卷积策略,具体为:
选取已有的卷积策略进行实例化,获得该卷积阶段对应的多个候选卷积策略。
4.根据权利要求1所述的方法,其特征在于,所述从所有所述候选卷积策略中筛选出该卷积阶段对应的最佳卷积策略,具体为:
测试所有所述候选卷积策略的可用性,从所有所述候选卷积策略中筛选出有效卷积策略;
测试所有所述有效卷积策略对应的运行时间,将最短运行时间对应的有效卷积策略确定为该卷积阶段对应的最佳卷积策略。
5.根据权利要求1所述的方法,其特征在于,所述获得该卷积层对应的最佳卷积策略组合,之后还包括:
将该卷积层对应的配置参数与该卷积层对应...
【专利技术属性】
技术研发人员:张广艳,李夏青,郑纬民,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。