System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于工业场景嵌入式处理器的神经网络加速计算方法技术_技高网

一种基于工业场景嵌入式处理器的神经网络加速计算方法技术

技术编号:40488780 阅读:7 留言:0更新日期:2024-02-26 19:20
本发明专利技术属于神经网络加速计算领域,具体涉及一种基于工业场景嵌入式处理器的神经网络加速计算方法。本发明专利技术通过将工业场景下的嵌入式处理器组网,构建算力池,当算力池内任意计算元需要算力时,算力池内各个计算元均可参与计算任务,聚合整个算力池下的全部可得算力,以此方法,算力不足但数量庞大的工业场景下嵌入式处理器也可用于部署算力需求大的神经网络,并且随组网规模提高,还可用于神经网络训练。

【技术实现步骤摘要】

本专利技术涉及一种神经网络加速计算方法,具体涉及一种基于工业场景嵌入式处理器的神经网络加速计算方法


技术介绍

1、目前深度学习、卷积等神经网络广泛应用于机器视觉、自然语言识别等场合,但工业场景下的嵌入式处理器受制于算力及结构难以直接部署神经网络,更不能对神经网络实施训练。

2、对于工业场景下的神经网络部署,主流方案是额外增设大算力设备,该类方案不但需要对原嵌入式处理器设置协议通讯,还需要限制大算力设备功耗,及设置其他工业温标等工业部署场景限制,使得此类方案难以在受成本制约的工业场景大规模应用,仅适合成本相对不敏感的车辆/舰船/航空自动驾驶领域。


技术实现思路

1、本专利技术的目的是解决现有额外增设大算力设备实现工业场景下神经网络部署的方案,需要对原嵌入式处理器设置协议通讯,还需要限制大算力设备功耗,及设置其他工业温标等工业部署场景限制,难以在受成本制约的工业场景大规模应用的技术问题,而提供一种基于工业场景嵌入式处理器的神经网络加速计算方法。

2、为实现上述目的,本专利技术所采用的技术方案为:

3、一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特殊之处在于,包括以下步骤:

4、s1、将多个嵌入式处理器内单指令多数据流的向量处理模式均锁定为n位模式,并将其操作系统编译为n位混合模式、打开其内核中n位混合模式状态;将多个待部署计算框架使用的框架指令编译为n位指令,并将精度调整至n位;n为16、32或64;

5、s2、将所有的嵌入式处理器进行组网,并在所有已组网嵌入式处理器上分别部署一个经过n位优化后的计算框架,建立算力池;算力池中的嵌入式处理器为计算元;

6、s3、获取算力池中各个计算元的id以及算力水平;

7、s4、客户端向算力池广播计算需求,算力池中的空闲计算元向客户端响应;

8、s5、客户端向响应的计算元分别发送各自的计算任务,当其中的任一计算元出现超过自身计算能力的计算任务时,则向算力池广播其所需的算力需求;

9、s6、有空闲算力的计算元响应该算力需求,并回复广播,发出算力需求的计算元根据自身需求在所有响应的计算元中进行选择使用,并向其发送计算任务;

10、s7、被选择的计算元执行计算任务,并向发出算力需求的计算元返回计算结果;

11、s8、发出算力需求的计算元在完成自身的计算任务后,整合自身的计算结果和其余被选择的计算元返回的计算结果,获得最终的计算结果;

12、s9、各个计算元向客户端返回各自的最终计算结果,完成加速计算。

13、进一步地,步骤3具体包括以下步骤:

14、s3.1、各个计算元进行初始化,并获取各自的算力水平;

15、s3.2、在任一计算元上线后,生成m位随机id,用于本次上线期间的身份识别;并向算力池广播自身id以及算力水平;

16、s3.3、收到广播的计算元,自行维护算力池内的计算元表,包括各个计算元id以及算力水平,从而获取算力池中各个计算元的id以及算力水平。

17、进一步地,在s3.1中,各个计算元通过压力测试获取各自的算力水平。

18、进一步地,在s1和s2中,n的取值为16。

19、进一步地,在s3.2中,m的取值为64。

20、进一步地,在s2中,组网方式采用以太网、wifi、lora或can。

21、与现有技术相比,本专利技术的有益效果是:

22、本专利技术通过将工业场景下的嵌入式处理器组网,构建算力池,当算力池内任意计算元需要算力时,算力池内各个计算元均可参与计算任务,聚合整个算力池下的全部可得算力,以此方法,算力不足但数量庞大的工业场景下嵌入式处理器也可用于部署算力需求大的神经网络,并且随组网规模提高,还可用于神经网络训练。

本文档来自技高网...

【技术保护点】

1.一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于,步骤3具体包括以下步骤:

3.根据权利要求2所述的一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于:

4.根据权利要求2或3所述的一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于:

5.根据权利要求4所述的一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于:

6.根据权利要求5所述的一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于:

【技术特征摘要】

1.一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于,步骤3具体包括以下步骤:

3.根据权利要求2所述的一种基于工业场景嵌入式处理器的神经网络加速计算方法,其特征在于:...

【专利技术属性】
技术研发人员:张蕾
申请(专利权)人:西安航空学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1