The invention discloses an embedded time series decision tree classification method and system at the edge end, which belongs to the real-time data classification and modeling at the edge end. The technical problem to be solved by the invention is how to realize the one-time modeling and processing of massive data while ensuring the memory requirement is efficient and time-consuming. The technical scheme adopted is: (1) an embedded time series decision at the edge end. The steps of tree classification are as follows: S1, edge collecting data and storing data in edge storage devices; S2, using VFDT algorithm to classify edge collecting data intelligently; S3, edge collecting classification results; S4, edge transmitting classification results to the cloud. (2) An embedded time series decision tree classification system at the edge end. The system includes edge devices, sensors and cloud devices. Sensors and edge devices connect and transmit data by wireless connection. Cloud devices and edge devices connect and transmit data by wireless or wired connection.
【技术实现步骤摘要】
一种边缘端的嵌入式时间序列决策树分类方法及系统
本专利技术涉及一种边缘端的实时数据分类建模,具体地说是一种边缘端的嵌入式时间序列决策树分类方法及系统。
技术介绍
对数据进行分类是常见的一个需求。不同于聚类算法,分类算法需要训练数据进行建模。建模完成之后,就可以使用这个模型进行不断的预测使用。最经典的分类算法是决策树,决策树利用信息学中信息增益的方法判断样本变量的重要性,然后根据重要性排序进行样本的区分。这样的方法的缺点在于很难对海量数据进行一次性的建模处理,因为需要大的内存并且耗时。近些年,随着大数据的出现,对流式数据的处理和研究成为热门领域。如何实现对海量数据进行一次性建模处理,同时确保内存需求量效且耗时短是目前急需解决的技术问题。专利号为CN104318270A的专利文献公开了一种基于MODIS时间序列数据的土地覆盖分类方法,该方法具体是按照以下步骤进行的:1、建立原始曲线;2、对原始曲线进行滤波拟合成初始曲线;3、建立初始曲线像元的无云影像二维数组;4、设置为阈值T,其中,Yi≠yi;5、处理过的原始曲线;6、得到重建后的NDVI年变化曲线;7、提取植被生长季参数组成特征影像;8、决定最终投票分类结果等步骤进行的;本专利技术应用于基于MODIS时间序列数据的土地覆盖分类领域。但是该技术方案要解决传统方法用时长、植被指数的负偏差以及SG重建结果准确性降低的问题,不能实现对海量数据进行一次性建模处理,同时确保内存需求量效且耗时短。
技术实现思路
本专利技术的技术任务是提供一种边缘端的嵌入式时间序列决策树分类方法及系统,来解决如何实现对海量数据进行一次性建模处 ...
【技术保护点】
1.一种边缘端的嵌入式时间序列决策树分类方法,其特征在于,该方法是将VFDT算法应用到边缘端的计算中,实现边缘端大数据量的计算且能够达到对实时处理要求高的需求;具体步骤如下:S1、边缘端收集数据并将数据存储到边缘端的存储设备中;S2、利用VFDT算法对边缘端收集数据进行智能分类处理;S3、边缘端获取分类结果;S4、边缘端将分类结果传输到云端。
【技术特征摘要】
1.一种边缘端的嵌入式时间序列决策树分类方法,其特征在于,该方法是将VFDT算法应用到边缘端的计算中,实现边缘端大数据量的计算且能够达到对实时处理要求高的需求;具体步骤如下:S1、边缘端收集数据并将数据存储到边缘端的存储设备中;S2、利用VFDT算法对边缘端收集数据进行智能分类处理;S3、边缘端获取分类结果;S4、边缘端将分类结果传输到云端。2.根据权利要求1所述的边缘端的嵌入式时间序列决策树分类方法,其特征在于,所述步骤S1中边缘端通过传感器采集数据,传感器安装到需要进行数据采集的位置完成数据采集,传感器实时将采集的数据发送到边缘端。3.根据权利要求1或2所述的边缘端的嵌入式时间序列决策树分类方法,其特征在于,所述步骤S2中VFDT算法实时的对流式数据进行分析处理,根据流入数据的特性进行分类判断,并判断决策树是否要进行更新。4.根据权利要求3所述的边缘端的嵌入式时间序列决策树分类方法,其特征在于,所述决策树进行更新的步骤如下:(1)、HT为有单个叶子结点l_1的决策树;(2)、赋值:(3)、按预测S中最频繁一类把值赋给(4)、对于每一类yk,每个xij值,赋值nijk(l1)=0;(5)、对于每个例子(x,yk),使用HT分类(x,y)成为叶子节点;对于每个xij,增加nijk(l);(6)、标记l;(7)、判断l中的例子是否为同一类:①、若不是同一类,则下一步执行步骤(8);(8)、对每个属性计算使用nijk(l)计数;(9)、按最高的为Xa赋值,据第二高的赋值Xb,计算∈;(10)、判断是否是且①、若是,则下一步执行步骤(11);(11)、用...
【专利技术属性】
技术研发人员:李锐,王相成,宗云兵,于治楼,段强,
申请(专利权)人:济南浪潮高新科技投资发展有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。