【技术实现步骤摘要】
一种应用于农业物联网的数据处理方法和装置
本专利技术涉及农业数据处理
,特别涉及一种应用于农业物联网的感测数据处理方法和装置。
技术介绍
如今农业信息化越来越受到广泛重视和应用,以农业信息技术为工具,用信息流调控农业活动的全过程,其主要是将农业生产管理信息化、农业经营管理信息化、农业科技学术信息化、以及农业资源环境信息化。现如今,农业物联网技术发展正处于初步应用阶段,其涵盖了传感器、网络通信、辅助支持以及自动控制等,通过对生长环境、生长过程、空气环境等进行实时监测,从而获取相应的信息。通过建立起的无线传感器网络对各方面所需的数据进行实时获取,从而精细化管理农产品的种养殖,而由于上述数据信息数据量较大,实时传输数据较多,且传感器长期暴露在野外高温高湿环境,错误数据较多,因此往往存在着数据缺失、数据错误、数值不完整、重复等错误、冗余数据的出现,从而导致输出的感测数据具有不确定性,可用性不高。因此,亟待提出一种对上述数据进行数据处理的方法。
技术实现思路
本专利技术实施例提供了一种应用于农业物联网的感测数据处理方法和装置,将数据流分段并行处理,并进行数据预处理,匹配出冗余数据,从而解决了现有农业物联网中因数据缺失、不完整、具有冗余数据导致的数据可用性不高等问题。为了解决上述问题,本专利技术公开了如下技术方案:第一方面,提供一种应用于农业物联网的感测数据处理方法,包括:传感器主节点收集其感测类型下的传感器实时传输的数据流,其中,所述传感器主节点是通过在具有不同所述感测类型的多个所述传感器中筛选每一类所述感测类型中具有最高准确度的所述传感器节点;将所述数据流切割成 ...
【技术保护点】
1.一种应用于农业物联网的感测数据处理方法,其特征在于,所述方法包括:传感器主节点收集其感测类型下的传感器实时传输的数据流,其中,所述传感器主节点是通过在具有不同所述感测类型的多个所述传感器中筛选每一类所述感测类型中具有最高准确度的所述传感器节点;将所述数据流切割成连续的多个初始数据集,建立和所述多个初始数据集数量相同的多条数据处理线程,每条所述数据处理线程对应一个初始数据集处理任务;对每个所述初始数据集进行预处理得到预处理后的数据集;在每个所述预处理后的数据集中选取代表性关键字,其中,所述预处理后的数据集包含多个数据块;通过在所述每个预处理后的数据集中选取的所述代表性关键字建立各自的关键字索引表,遍历所述预处理后的数据集中的所述数据块与所述关键字索引表指向的数据块是否相同;当遍历到存在相同数据块时,从所述预处理后的数据集中删除所述相同数据块;当遍历到不相同数据块时,进而判断其他所述关键字索引表指向的数据块中是否存在所述不相同数据块,将所述不相同数据块的索引添加到所述关键字索引表中。
【技术特征摘要】
1.一种应用于农业物联网的感测数据处理方法,其特征在于,所述方法包括:传感器主节点收集其感测类型下的传感器实时传输的数据流,其中,所述传感器主节点是通过在具有不同所述感测类型的多个所述传感器中筛选每一类所述感测类型中具有最高准确度的所述传感器节点;将所述数据流切割成连续的多个初始数据集,建立和所述多个初始数据集数量相同的多条数据处理线程,每条所述数据处理线程对应一个初始数据集处理任务;对每个所述初始数据集进行预处理得到预处理后的数据集;在每个所述预处理后的数据集中选取代表性关键字,其中,所述预处理后的数据集包含多个数据块;通过在所述每个预处理后的数据集中选取的所述代表性关键字建立各自的关键字索引表,遍历所述预处理后的数据集中的所述数据块与所述关键字索引表指向的数据块是否相同;当遍历到存在相同数据块时,从所述预处理后的数据集中删除所述相同数据块;当遍历到不相同数据块时,进而判断其他所述关键字索引表指向的数据块中是否存在所述不相同数据块,将所述不相同数据块的索引添加到所述关键字索引表中。2.根据权利要求1所述的方法,其特征在于,进一步的,所述传感器主节点是通过在具有不同所述感测类型的多个所述传感器中筛选每一类所述感测类型中具有最高准确度的所述传感器节点包括:通过周期历史记录选择具有最高准确度的所述感测类型的传感器节点作为所述传感器主节点。3.根据权利要求1所述的方法,其特征在于,进一步的,所述对每个所述初始数据集进行预处理得到预处理后的数据集包括:删除所述初始数据集中含有过多缺失值的数据和删除含有较少完整值的数据,然后对删除后的所述初始数据集进行分块,分为完整数据子集和缺失数据子集两部分,所述完整数据子集存放完整的数据,所述缺失数据子集存放含有缺失值的数据,根据邻域半径的大小和邻域内最小值点的个数,对两个数据子集划分成多个簇,根据所述簇的中心点与所述缺失数据子集中的数据的相似度的计算值进行数据填充,选择距离数据最近的中心点所属于的簇并把所述数据赋给该簇,最后,合并所述完整数据子集和填充处理后的所述缺失数据子集得到所述预处理后的数据集。4.根据权利要求2所述的方法,其特征在于,进一步的,所述在每个所述预处理后的数据集中选取代表性关键字包括:均匀抽样选择所述每个预处理后的数据...
【专利技术属性】
技术研发人员:毛利,叶惠娟,胡永盛,刘小更,李鑫,窦小勇,吴加权,周斌,申倩,
申请(专利权)人:江苏农牧科技职业学院,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。