一种基于云计算的北斗林业数据采集与处理方法技术

技术编号：12885983 阅读：80 留言：0更新日期：2016-02-17 17:05

本发明专利技术公开了一种基于云计算北斗林业数据采集与处理方法。其特征是：利用北斗卫星定位PDA对林业小班数据进行采集，并存储到GIS Server云端。根据Hadoop平台的MapReduce算法，处理具有时间属性和空间属性的林业海量HDFS文件，部署决策树C5.0算法，使用Hadoop中的JPA建立决策树的算法，可实现对林业数据处理和挖掘，发现林业知识。

全部详细技术资料下载

【技术实现步骤摘要】
【专利说明】一、
本专利技术是一种林业数据采集与处理方法，特别是一种基于北斗卫星的林业数据采集方法和基于云计算平台的林业数据处理与应用方法。二、技术背景林业作为我国传统行业，在我国生态环境、生态文明建设中起着十分重要的作用。然而，传统的林业数据采集与处理信息化程度较低。林业野外数据采集大量使用纸质文档，每次调查都需要都要携带各类调查卡片，手工记录调查数据，内业还要将数据录入到系统中。传统的野外作业方式消耗人力资源大，工作效率低，且易发生调查卡片丢失、污损、数据录入错误及人为误差等情况，制约着现今野外作业调查的效率。在日常的巡山护林等工作中，由于采用纸质登记方式对每日巡山护林状况进行记录，容易发生工作人员少巡漏巡作业区的情况，有关部门缺乏必要的监管；作业人员在野外如遇突发情况，也难快速确定事发位置，不便救援力量及时抵达。林业中的应用已由单一的数据采集阶段，经过信息管理阶段，进入到了数据挖掘与知识发现阶段，通过数据挖掘帮助森林资源管理者明确目标，建立和修改模型，提供多种优化方案，以提高决策能力及决策效益，实现科学管理、集约经营、提高森林经营水平和森林可持续发展，使林业从过去单一、粗放的经营管理模式走向精准、系统的模式。然而，林业数据是关于地球表面信息的数据，具有区域性、多维性和时序性，是连接各种信息形成一个在空间和时间上连续分布的综合信息的基础。海量林业数据成为林业数据挖掘的一个瓶颈，传统林业数据挖掘方法已经不能满足处理海量林业数据的需要。鉴于传统林业数据挖掘方法的种种弊端，本专利技术对林业数据采集和处理的方法了改进和创新，利用北斗卫星定位PDA，对林业小...

【技术保护点】
一种基于云计算的北斗林业数据采集与处理方法，其特征是：首先，利用北斗PDA对林业小班数据进行采集，将采集到的数据存储在GIS Server云端。其次，安装Ubuntu操作系统，在该linux系统上安装hadoop，部署NameNode，master，jobTracker master作为中心服务器，其他作为从属服务器，并ping接成功，构建基于Hadoop的云计算平台。再次，将海量林业数据文件直接上传至Hadoop的HDFS中进行存储，用FileSystem API读取林业数据文件。利用MapReduce对林业数据进行分块化操作，使用分布式数据仓库Hive从分布式数据库HBase中获取。部署决策树C5.0算法。最后，利用调用Hadoop中的JPA建立决策树的算法，林业数据被分配到多个mapper，调用BuildTree对林业数据进行挖掘，进而发现林业知识。

【技术特征摘要】

【专利技术属性】
技术研发人员：吴言松，
申请(专利权)人：北斗恒星北京科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人