基于中央数据池的遥感信息提取模型分布式训练方法技术

技术编号：38213790 阅读：9 留言：0更新日期：2023-07-25 11:22

本发明专利技术公开了基于中央数据池的遥感信息提取模型分布式训练方法，本发明专利技术弃用TensorFlow的分布式训练方法，使用Horovod分布式训练框架对TensorFlow单机程序进行ring

全部详细技术资料下载

【技术实现步骤摘要】
基于中央数据池的遥感信息提取模型分布式训练方法

[0001]本专利技术涉及数据训练
，具体涉及基于中央数据池的遥感信息提取模型分布式训练方法。

技术介绍

[0002]遥感影像提取在气象、智慧城市、军事等领域具有广泛的应用。近年来，随着高分辨率和宽覆盖成像等遥感技术的不断进步和发展，遥感卫星使用频率越来越高的同时，遥感影像的数据量也在急剧地升，单幅能有GB级别的大小，整轨数据量甚至突破百GB乃至TB级别，这在给应用领域带来大量数据的同时也加大了处理难度。事实上，在使用单机训练遥感影像提取模型时，大规模训练集和高复杂度模型通常不能被完整的存储，而且其训练时间也令人无法忍受。例如把TB级以上的遥感数据放在一台计算机上，以目前的数据传输技术和计算机性能，模型的训练进度将非常迟缓，这时通常会对整体数据进行分配。又比如深度学习模型在训练过程中会产生大量的矩阵运算，运算的结果和中间值通常保存在内存或者显存当中，而有些深度学神经网络参数量过多，那么CNN层权值矩阵所占用的存储空间可能将会超过单个GPU显存的容量。这时需要将CNN层的超大矩阵做分块处理，可将其拆分到不同的显卡上进行协同计算。故而，多节点多显卡协同并行训练的分布式技术在深度学习网络训练中地应用显得尤为重要。
[0003]TensorFlow作为工业化背景最成熟的深度学习框架，自其被推出以来凭借着谷歌公司强劲的科技实力背景以及其本身较为稳定的性能和较为完善的功能等特点，一直统治着人工智能领域深度学习框架市场，受到了各种开源团队的推崇与维护，现已更新至2.11...

【技术保护点】

【技术特征摘要】
1.基于中央数据池的遥感信息提取模型分布式训练方法，其特征在于：包括以下步骤：步骤S1、建立LMDB数据集：引入LMDB数据进行分布式深度学习模型训练，其中LMDB数据为原始数据并通过LMDB数据库原语制作而成，为数据并行提供数据源；步骤S2、生成数据块指针集：基于S1步骤建立的LMDB数据集，通过基于构建中央数据池的数据切分方法在训练初始化时对其进行实时切割，生成供网络训练的数据块指针集，为朴素分布式训练提供训练数据地址；步骤S3、进行朴素分布式训练：基于S2步骤生成的数据块指针集，通过中央数据池数据加载方法将训练数据从磁盘映射至内存，而后集群据此映射数据对模型进行朴素梯度下降情况下的多机分布式深度学习训练。2.根据权利要求1所述的基于中央数据池的遥感信息提取模型分布式训练方法，其特征在于：所述步骤S1的具体步骤如下：将图像数据裁剪至多个小块数据并对其进行标准化，然后使用原语操作对所述每块数据进行编号并通过set<key，value>键值对的关系给每块数据赋予唯一的地址值，数据块(value)和地址值(key)呈现出一一对应的关系，最终得到整个数据集，每个set变量构成单个数据块实体，数据集整体即为set集合；set集合:{set1,set2,
……
setn
‑
1,setn}，其中n代表第n块数据的编号。3.根据权利要求1所述的基于中央数据池的遥感信息提取模型分布式训练方法，其特征在于：所述步骤S2的具体步骤如下：基于S1步骤生成的set集合，抽取set集合中的key值，形成key值集合，然后将其随机打乱，构成乱序key值集合，乱序数据有效提升模型的训练精度；乱序key集合:{key3,key1,key4,
……
keyn,keyn
‑
1}，其中n代表第n块数据的编号。4.根据权利要求1所述的基于中央数据池的遥感信息提取模型分布式训练方法，其特征在于：所述步骤S3的具体步骤如下：步骤S3.1将训练样本数据从文件系统中映射至内存空间：基于步骤S2生成的乱序key值集合，设有方法getValue(key)可以通过地址值获得数据块，则有getValue(keyn)＝Dn，...

【专利技术属性】
技术研发人员：赫晓慧，李盼乐，程淅杰，乔梦佳，高亚军，李加冕，周涛，赵辉杰，
申请(专利权)人：郑州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人