【技术实现步骤摘要】
本专利技术涉及一种神经网络推理方法,尤其涉及一种面向多边缘设备的transformer模型协同推理方法,属于边缘计算领域。
技术介绍
1、随着大数据和人工智能等高新技术的快速发展,transformer作为深度神经网络(deep neural network,dnn)中的基础模型,在绝大多数计算机视觉、自然语言处理和语音识别等领域的智能应用中取得了超越人类的表现。考虑到低延时和隐私性的需求,将transformer模型部署于手机、开发板等边缘设备上实现智能应用具有重要意义。但是,transformer模型计算复杂度高,内存开销大,而边缘设备通常计算资源有限,并且功率和内存远小于工作站或者服务器,因此transformer模型难以直接部署在边缘设备上实现智能应用。以经典的视觉transformer模型vit-l/16为例,其进行一次推理需要5.3gb的内存和123.1g的浮点运算次数,而树莓派4b+边缘设备仅有4gb的内存空间和13.5g浮点运算次数/秒的计算性能,无法部署transformer实现智能应用。
2、针对上述问题
...【技术保护点】
1.一种面向多边缘设备的Transformer模型协同推理方法,其特征在于:包括以下步骤,
2.如权利要求1所述的一种面向多边缘设备的Transformer模型协同推理方法,其特征在于:步骤一实现方法为,
3.如权利要求2所述的一种面向多边缘设备的Transformer模型协同推理方法,其特征在于:步骤二实现方法为,
4.如权利要求3所述的一种面向多边缘设备的Transformer模型协同推理方法,其特征在于:步骤三实现方法为,
5.如权利要求4所述的一种面向多边缘设备的Transformer模型协同推理方法,其特征在于
...【技术特征摘要】
1.一种面向多边缘设备的transformer模型协同推理方法,其特征在于:包括以下步骤,
2.如权利要求1所述的一种面向多边缘设备的transformer模型协同推理方法,其特征在于:步骤一实现方法为,
3.如权利要求2所述的一种面向多边缘设备的transformer模型...
【专利技术属性】
技术研发人员:徐冠宇,郝志伟,付莹,胡晗,范戎飞,郇鑫焘,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。