【技术实现步骤摘要】
深度学习加速方法及用户终端
本专利技术涉及计算机
,具体涉及一种深度学习加速方法和用户终端。
技术介绍
深度学习方法用于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。不同的深度学习架构下建立的学习模型是不同的,例如,卷积神经网络(Convolutionalneuralnetworks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(DeepBeliefNets,简称DBNs)就是一种无监督学习下的机器学习模型。基于卷积神经网络的深度学习架构处理信息数据时的准确率高,但是基于卷积神经网络的深度学习架构的数据和计算量都十分巨大,过去基于卷积神经网络的深度学习架构的计算需要在云端服务器上上才可以顺利执行,训练完成的结果还需要透过网络传输将其送至终端,此过程既费时,也需要透过安全的管道传输才可确保数据的安全。
技术实现思路
鉴于以上内容,有必要提出一种深度学习加速方法及用户终端,使得深度学习架构的计算能够在用户终端上有效率的实现,不需要用户终端去 ...
【技术保护点】
1.一种深度学习加速方法,其特征在于,所述方法包括,/n调取完整的深度学习架构,所述完整的深度学习架构包括卷积层的数据运算程序以及全连接层的数据运算程序;/n获取所述深度学习架构中卷积层的数据运算程序,并舍弃全连接层的数据运算程序,加载所述卷积层的数据运算程序至用户终端的第一处理器上;/n获取一应用对应的全连接层的数据运算程序,并将所述应用对应的全连接层的数据运算程序加载至所述用户终端的第二处理器上,其中,不同的应用对应不同的全连接层数据运算程序;/n将使用所述第一处理器执行卷积层运算得到的结果输入至所述第二处理器中继续执行全连接层运算,进而在所述用户终端上完成完整的深度学 ...
【技术特征摘要】
1.一种深度学习加速方法,其特征在于,所述方法包括,
调取完整的深度学习架构,所述完整的深度学习架构包括卷积层的数据运算程序以及全连接层的数据运算程序;
获取所述深度学习架构中卷积层的数据运算程序,并舍弃全连接层的数据运算程序,加载所述卷积层的数据运算程序至用户终端的第一处理器上;
获取一应用对应的全连接层的数据运算程序,并将所述应用对应的全连接层的数据运算程序加载至所述用户终端的第二处理器上,其中,不同的应用对应不同的全连接层数据运算程序;
将使用所述第一处理器执行卷积层运算得到的结果输入至所述第二处理器中继续执行全连接层运算,进而在所述用户终端上完成完整的深度学习架构并进行训练。
2.如权利要求1所述的深度学习加速方法,其特征在于,所述深度学习架构是基于VGG16的神经网络架构。
3.如权利要求1所述的深度学习加速方法,其特征在于,加载所述卷积层的数据运算程序至用户终端的第一处理器之前,所述方法还包括:根据所述卷积层的数据量和所述第一处理器中存储器的容量,判断是否需要将所述卷积层进行分割,如果所述卷积层数据量超过所述第一处理器中存储器的最大容量值,则将所述卷积层按照卷积层的层数进行分割,并将分割后的卷积层分别加载至所述用户终端的至少一个其他第一处理器。
4.如权利要求1所述的深度学习加速方法,其特征在于,所述第一处理器为卷积层数据运算的专用处理器,所述第一处理器为现场可编程门阵列、数字信号处理器或专用集成电路中任一种。
5.如权利要求1所述的深度学习加速方法,其特征在于,所述不同的应用对应不同的全连接层数据运算程序包括不同的应用对应的全连接层的层数和/或神经元的数目不同。
6.如权利要求1所述的深度学习加速方法,其特征在于,所述用户终端为智能手机、平板电脑、膝上型便捷计算机...
【专利技术属性】
技术研发人员:郭锦斌,蔡东佐,孙国钦,
申请(专利权)人:富泰华工业深圳有限公司,鸿海精密工业股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。