分布式图像识别的智能模型训练方法及系统技术方案

技术编号：27974929 阅读：59 留言：0更新日期：2021-04-06 14:09

本发明专利技术涉及一种分布式图像识别的智能模型训练方法及系统,包括在边缘服务器上创建任务池和结果池；每个边缘工作节点从所述任务池中随机获取一个任务；计算所述任务，所述边缘工作节点将结果放入所述结果池中；所述边缘服务器从所述结果池中取出所有结果，并将所有结果集成到最终结果中。本发明专利技术不但训练时间少、健壮性和安全性高，而且能够在边缘嵌入式设备上运行。

全部详细技术资料下载

【技术实现步骤摘要】
分布式图像识别的智能模型训练方法及系统
本专利技术涉及人工智能、图像识别的
，尤其是指一种分布式图像识别的智能模型训练方法及系统。
技术介绍
深度学习在边缘计算中得到了深入研究，而高效的图像处理技术都是基于深度学习算法的。如何将深度学习的卷积神经网络(CNNs)在边缘设备上部署，使用边缘的嵌入式设备分布式训练图像分类模型，具有广泛的应用前景。在边缘嵌入式设备上训练深度学习模型会面临如下三个方面的挑战：首先，通信时延会影响主节点向边缘节点传输数据所需的时间；第二，通信带宽限制了单位时间内从主节点传输到边缘节点的数据量；第三，边缘节点的计算能力会影响整个计算系统的计算能力；第四，在单个边缘嵌入设备上训练CNN模型是难以实现的。因此，边缘设备的计算能力会弱于云计算，必须使用分布式计算方法来组合多个边缘嵌入式设备来提高其计算能力。数据并行和模型并行是分布式深度学习提升运算能力的两种常用方法。所谓数据并行就是将未经训练的模型复制到多个计算设备上，使它们拥有相同的模型，然后将数据集划分给它们进行并行训练。数据并行可以加快CNN模型的训练速度，但要求从属计算设备能够独立训练整个模型。然而，一般的边缘嵌入式设备无法满足这一要求。所谓模型并行是将大型模型分割成不同的部分，并将其部署到多个计算设备上，使无法在一台计算机上进行训练的大型模型，能够在分布式环境中进行训练。但是边缘设备容易出现掉队问题，会造成模型并行的训练过程失败。因此，上述两种分布式深度学习方法并不适合边缘嵌入式设备，必须设计一种新的分布式计算方法来在...

【技术保护点】
1.一种分布式图像识别的智能模型训练方法，其特征在于，包括如下步骤：/n步骤S1：在边缘服务器上创建任务池和结果池；/n步骤S2：每个边缘工作节点从所述任务池中随机获取一个任务；/n步骤S3：计算所述任务，所述边缘工作节点将结果放入所述结果池中；/n步骤S4：所述边缘服务器从所述结果池中取出所有结果，并将所有结果集成到最终结果中。/n

【技术特征摘要】
1.一种分布式图像识别的智能模型训练方法，其特征在于，包括如下步骤：
步骤S1：在边缘服务器上创建任务池和结果池；
步骤S2：每个边缘工作节点从所述任务池中随机获取一个任务；
步骤S3：计算所述任务，所述边缘工作节点将结果放入所述结果池中；
步骤S4：所述边缘服务器从所述结果池中取出所有结果，并将所有结果集成到最终结果中。

2.根据权利要求1所述的分布式图像识别的智能模型训练方法，其特征在于：计算所述任务的方法为：将图像数据进行处理转换为第一矩阵，将权值参数转换为第二矩阵，将所述第一矩阵均匀地分割成许多第一矩阵块，然后使用编码矩阵对所述第一矩阵块进行编码；制作计算任务；将所述计算任务分配给所述边缘工作节点；收集从所述边缘工作者节点返回的结果，并将其合并到所述第一矩阵与第二矩阵相乘的结果中。

3.根据权利要求2所述的分布式图像识别的智能模型训练方法，其特征在于：使用编码矩阵对所述第一矩阵块进行编码时，对第一矩阵块进行冗余编码。

4.根据权利要求3所述的分布式图像识别的智能模型训练方法，其特征在于：对第一矩阵块进行冗余编码的方法为：将所述第一矩阵划分为n个较小的第一矩阵块，然后对所述第一矩阵块进行冗余编码，利用所述编码矩阵对n个第一矩阵块进行编码；最后，得到m个编码的第二矩阵块，其中m>n。...

【专利技术属性】
技术研发人员：李领治，成聪，王进，谷飞，戴欢，
申请(专利权)人：苏州大学，赛尔网络有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人