当前位置: 首页 > 专利查询>中科遥感深圳卫星应用创新研究院有限公司专利>正文

spark结合tensorflow进行遥感影像信息提取的方法技术

技术编号：21714303 阅读：47 留言：0更新日期：2019-07-27 19:11

本发明专利技术公开了一种spark结合tensorflow进行遥感影像信息提取的方法，包括以下步骤：（Ⅰ）构建分布式存储系统，存储元数据信息；（Ⅱ）分布式计算集群与机器学习tensorflow结合；（Ⅲ）直接读取分布式存储系统上的遥感影像数据；（Ⅳ）编写分布式上遥感影像信息提取的机器学习算法；（Ⅴ）使用spark将数据进行分片并读取到内存队列。本发明专利技术提供了一种spark结合tensorflow进行遥感影像信息提取的方法，采用分布式存储、分布式计算结合机器学习的技术路线，实现遥感信息快速、批量提取，提高了遥感影像数据提取的处理能力与效率。

Spark and tensorflow for remote sensing image information extraction

全部详细技术资料下载

【技术实现步骤摘要】
spark结合tensorflow进行遥感影像信息提取的方法
本专利技术涉及遥感影像数据提取方法的
，特别涉及一种spark结合tensorflow进行遥感影像信息提取的方法。
技术介绍
遥感信息产品是指通过对遥感影像各地物的光谱、空间、纹理、物候等特征进行分析，选择各地物特征，对影像中的像元或具体对象按照一定规则、模型、算法划分为不同的地物类型，从而获得带空间信息的实际地物对应信息，实现基于遥感影像的信息提取。最后，形成诸如土地利用现状分类、林种划分、新增建设物识别、基本农田侵占等专题地图。传统的遥感信息产品需要人工借助专业软件进行生产，一方面成本较高，另一方面效率与处理能力都比较低。
技术实现思路
本专利技术是为了克服现有技术中存在的缺点而提出的，其目的是提供一种spark结合tensorflow进行遥感影像信息提取的方法。本专利技术的技术方案是：一种spark结合tensorflow进行遥感影像信息提取的方法，包括以下步骤：（Ⅰ）构建分布式存储系统，存储元数据信息构建自主存储海量文件的遥感影像数据的分布式存储系统，采用分布式nosql数据库存储文件的元数据信息；（Ⅱ）分布式计算集群与机器学习tensorflow结合实现分布式计算集群与机器学习tensorflow结合，分布式计算集群负责为tensorflow分配计算资源和数据分片，分布式计算集群根据任务需求在计算节点上创建独立的运行容器，并在该容器上运行tensorflow的worker节点，实现模型算法的计算；（Ⅲ）直接读取分布式存储系统上的遥感影像数据针对开源gdal源码进行修改，增加文件存储标...

【技术保护点】
1. 一种spark结合tensorflow进行遥感影像信息提取的方法，其特征在于：包括以下步骤：（Ⅰ）构建分布式存储系统，存储元数据信息构建自主存储海量文件的遥感影像数据的分布式存储系统，采用分布式nosql数据库存储文件的元数据信息；（Ⅱ）分布式计算集群与机器学习tensorflow结合实现分布式计算集群与机器学习tensorflow结合，分布式计算集群负责为tensorflow分配计算资源和数据分片，分布式计算集群根据任务需求在计算节点上创建独立的运行容器，并在该容器上运行tensorflow的worker节点，实现模型算法的计算；（Ⅲ）直接读取分布式存储系统上的遥感影像数据针对开源gdal源码进行修改，增加文件存储标识，并且重载原有读取文件方法，引入hdfs读写方法库，实现对hdfs文件系统上文件读取，然后根据文件存储标识，为0则存储于本地，调用gdal原先文件读取方法，位1则存储于分布式存储系统上，则调用重载的读取文件方法；（Ⅳ）编写分布式上遥感影像信息提取的机器学习算法编写分布式上遥感影像信息提取的机器学习算法，算法处理流程分为模型训练和模型应用；（Ⅴ）使用spark将数据...

【技术特征摘要】
1.一种spark结合tensorflow进行遥感影像信息提取的方法，其特征在于：包括以下步骤：（Ⅰ）构建分布式存储系统，存储元数据信息构建自主存储海量文件的遥感影像数据的分布式存储系统，采用分布式nosql数据库存储文件的元数据信息；（Ⅱ）分布式计算集群与机器学习tensorflow结合实现分布式计算集群与机器学习tensorflow结合，分布式计算集群负责为tensorflow分配计算资源和数据分片，分布式计算集群根据任务需求在计算节点上创建独立的运行容器，并在该容器上运行tensorflow的worker节点，实现模型算法的计算；（Ⅲ）直接读取分布式存储系统上的遥感影像数据针对开源gdal源码进行修改，增加文件存储标识，并且重载原有读取文件方法，引入hdfs读写方法库，实现对hdfs文件系统上文件读取，然后根据文件存储标识，为0则存储于本地，调用gdal原先文件读取方法，位1则存储于分布式存储系统上，则调用重载的读取文件方法；（Ⅳ）编写分布式上遥感影像信息提取的机器学习算法编写分布式上遥感影像信息提取的机器学习算法，算法处理流程分为模型训练和模型应用；（Ⅴ）使用spark将数据进行分片并读取到内存队列在模型训练时，使用spark将数据进行分片并读取到内存队列中，运行于多个节点上的tensorflow计算任务，从内存队列中读取自己需要处理的数据进行处理，各个节点上读取数据与spark将数据从hdfs读取到内存队列中是同步的。2.根据权利要求1所述的一种spark结合tensorflow进行遥感影像信息提取的方法，其特征在于：所述元数据信息包括文件的大小、路径、存储位置或时间。3.根据权利要求1所述的一种spark结合tensorflow进行遥感影像信息提取的方法，其特征在于：所述步骤（Ⅰ）中存储文件的元数据信息时，根据设置的文件大小设置存储位置。4.根据权利要求1所述的一种spark结合tensorflow进行遥感影像信息提取的方法，其特征在于：所述步骤（Ⅰ）中存储文件的...

【专利技术属性】
技术研发人员：李文东，李涛，檀飞腾，
申请(专利权)人：中科遥感深圳卫星应用创新研究院有限公司，中科遥感科技集团有限公司，广东中科遥感技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人