【技术实现步骤摘要】
一种基于权重的时间序列数据降维与多分辨率表示方法
本专利技术涉及一种基于权重的时间序列数据降维与多分辨率表示方法,尤其涉及了一种基于分段线性表示(Piecewiselinearrepresentation,PLR)的“高维”时间序列数据的数据降维与多分辨率数据可视化方法,属于数据分析与数据挖掘的
技术介绍
随着“互联网+”时代的到来,各种基于网络技术、移动通信技术、物联网技术的应用层出不穷,在各种电子商务活动以及各种工业信息化交互中都产生了大量的、基于时间序列的业务数据信息,被称为时间序列数据(TimeSeriesData)。时间序列数据不仅反映了数据在某一时刻的状态信息,时序数据整体也反映了一定的数据变化规律和趋势。过去几年随着社交网络的不断发展壮大、工业4.0概念的提出,社会已经进入了大数据时代(2013年也被称为大数据元年),这就意味着大数据开始进入商用阶段,因此,针对时间序列数据的分析与挖掘的相关研究工作也愈演愈烈,逐渐成为大数据分析与挖掘的热点问题之一。目前,传统的数据分析与数据可视化技术无法直接应用于时间序列数据的研究,主要包括以下几方面的原因:1、数据存储成本大、数据分析代价高时间序列数据一般具有“海量”、“高维”、“连续”等特点,与传统的静态数据有很大的不同,受制于相应的计算代价与存储成本的限制,无法对时间序列原始数据直接开展相应的数据分析与挖掘研究工作。因此,需要在分析之前进行相应的数据降维与简化表示操作。2、数据降维与数据简化表示思路相对局限目前,基于时间序列的降维操作,往往仅局限于时序数据中的极值点,并以极值点的权重作为数据 ...
【技术保护点】
1.一种基于权重的时间序列数据降维与多分辨率表示方法,其特征在于,该方法以基于“自顶向下”的分段线性表示为基准,包括步骤如下:S1,预设数据压缩率DCR阈值ρ;S2,将时间序列数据TS的起始点vt1和终止点vtn选定为初始数据分段点,计算时间序列数据TS的任意数据点权重和当前数据分段权重,并将vt1、vt2转换成相应的链表节点存入MRISL中;S3,根据S2的处理结果,从此步骤开始,利用TS分段表示策略,从当前分段中选择具有mw_es的数据分段,并从该分段中选择具有mw_sp的数据点vtk,作为新的数据分段点,并对当前数据分段进行再次细分;S4,判断当前MRSIL中的数据点个数numcur是否已经超过了ρ的限制,如果没有超过,则继续执行步骤S3,否则,步骤S3终止,相应的MRSI建立完毕;S5,通过基于TS建立的MRSI以及相应的DCR,实现(0,ρ)范围内的,任意数据压缩率DCR下的数据多分辨率简化表示。
【技术特征摘要】
1.一种基于权重的时间序列数据降维与多分辨率表示方法,其特征在于,该方法以基于“自顶向下”的分段线性表示为基准,包括步骤如下:S1,预设数据压缩率DCR阈值ρ;S2,将时间序列数据TS的起始点vt1和终止点vtn选定为初始数据分段点,计算时间序列数据TS的任意数据点权重和当前数据分段权重,并将vt1、vt2转换成相应的链表节点存入MRISL中;S3,根据S2的处理结果,从此步骤开始,利用TS分段表示策略,从当前分段中选择具有mw_es的数据分段,并从该分段中选择具有mw_sp的数据点vtk,作为新的数据分段点,并对当前数据分段进行再次细分;S4,判断当前MRSIL中的数据点个数numcur是否已经超过了ρ的限制,如果没有超过,则继续执行步骤S3,否则,步骤S3终止,相应的MRSI建立完毕;S5,通过基于TS建立的MRSI以及相应的DCR,实现(0,ρ)范围内的,任意数据压缩率DCR下的数据多分辨率简化表示。2.根据权利要求1所述的一种基于权重的时间序列数据降维与多分辨率表示方法,其特征在于,所述步骤S2,计算时间序列数据TS的任意数据点权重,包括:设时间序列数据TS的拟合直线为连接起始点vt1和终止点vtn的线段,即TSline=(vt1,vtn),则TS上任意数据点vti的权重fe_spi为数据点vti到TSline的垂直距离,具体计算如公式(Ⅰ)所示式(Ⅰ)中,时序点vt1包括具体的时刻t1及该时刻的实测数据值v1,vt1=(v1,t1);时序点vtn包括具体的时刻tn及该时刻的实测数据值vn,vtn=(vn,tn);时序点vti包括具体的时刻ti及该时刻的实测数据值vi,vti=(vi,ti);起始点vt1的权重、终止点vtn的权重均为0。3.根据权利要求1所述的一种基于权重的时间序列数据降维与多分辨率表示方法,其特征在于,所述步骤S2,计算时间序列数据TS的当前数据分段权重,包括:a、选取时间序列数据TS上权重最大的对应的数据点,设定为vtk,数据点vtk的权重fe_spk被称为时间序列数据TS中的最大单点权重mw_sp,计算如公式(Ⅱ)所示:b、假设将当前时间序列数据TS看成一个数据分段,时间序列数据TS的w_es的计算如公式(Ⅲ)所示:c、假设时间序列数据TS当前的分段数目为K,即TS={S1,S2,…,SK},通过公式(Ⅰ)、公式(Ⅱ)分别计算当前K个数据分段的分段权重,并利用公式(Ⅳ)获取时间序列数据TS的当前最大分段权重mw_es:4.根据权利要求1所述的一种基于权重的时间序列数据降维与多分辨率表示方法,其特征在于,所述步骤S2,将vt1、vt2转换成相应的链表节点存入数据分段点列表MRISL中,数据分段点列表MRISL为一个存储数据分段点的数据链表,包括步骤如下:d.根据时间序列数据TS分段策略所获取的数据分段点定义为相应的链表节点(listnode,LN),时间序列数据TS分段策略所获取的数据分段点是指当前具有mw_es的数据分段中被标记为mw_sp的数据点,并将此LN依次存入数据分段点列表MRISL中,LN的数据结构包括index、value、rank、weightL、weightR、mes、ets,index是指数据分段点在TS中的原始位置,value是指数据分段点的原始数据值,rank是指数据分段点的选出次序;weightL是指分段点左侧的数据分段的权重值;weightR是指分段点右侧的数据分段的权重值;mes是指当前TS的mw_es值;ets是指当前TS的整体权重值。5.根据权利要求1所述的一种基于权重的时间序列数据降维与多分辨率表示方法,其特征在于,ets表示当某个具体的数据分段点被选取出来,对当前时间序列...
【专利技术属性】
技术研发人员:胡宇鹏,赵新晓,李学庆,秦东,黄刚叶,
申请(专利权)人:山东大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。