The invention discloses a method for selection of significant variables slope correlation degree based on the slope correlation model, by first calculating the slope of each variable time series, then calculate the correlation coefficient obtained correlation, and correlation order, reflect the correlation degree from large to small order, is its geometric significance at the same time, the slope of the curve changes more closely, the greater the degree of correlation, finally we as significant variables on the choice of factors associated with larger and more significant variables, the higher the similarity of time series representation.
【技术实现步骤摘要】
一种基于斜率关联度的显著变量选择方法
本专利技术属于时间序列分析
,更为具体地讲,涉及一种基于斜率关联度的显著变量选择方法。
技术介绍
随着计算机软件和硬件的快速发展,人们对日常生活中积累的数据信息的关注和分析也日趋增加,这些数据中大多都是与时间相关的,可以简要说是与时间序列相关的。例如,气象预报中降雨量数据序列、股票价格波动数据序列、某产品的交易或销售数据序列等等,这些数据按照时间先后组成时间序列数据。从统计意义上讲,所谓时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上的依赖关系。而从这些时间序列数据中挖掘出隐含的有价值的数据信息,有利于揭示或预测时间序列事件变化规律,从而发现历史序列数据和现今及未来数据之间的联系及相互关系,即以某种标准来度量时间序列之间的相似性,并以此为基础来分析时间序列数据之间的相似性问题目前,灰色关联分析被广泛采用,其中,邓氏关联度是最早最为经典的关联度模型。按照邓氏关联度的定义和基本思想,关联度体现的实际上是两序列曲线之 ...
【技术保护点】
一种基于斜率关联度的显著变量选择方法,其特征在于,包括以下步骤:(1)、分析历史数据,确定以特征序列作为目标变量的历史数据而构成的时间序列,以及以影响因素序列作为各影响因素的历史数据而构成的时间序列;(2)、对特征序列和影响因素序列进行异常值和缺失值处理,得到完整历史时间序列;(3)、对完整历史时间序列进行定量分析,并运用斜率关联模型计算出每个影响因素和目标变量之间的关联度;(3.1)、计算变量的斜率:
【技术特征摘要】
1.一种基于斜率关联度的显著变量选择方法,其特征在于,包括以下步骤:(1)、分析历史数据,确定以特征序列作为目标变量的历史数据而构成的时间序列,以及以影响因素序列作为各影响因素的历史数据而构成的时间序列;(2)、对特征序列和影响因素序列进行异常值和缺失值处理,得到完整历史时间序列;(3)、对完整历史时间序列进行定量分析,并运用斜率关联模型计算出每个影响因素和目标变量之间的关联度;(3.1)、计算变量的斜率:其中,k=0表示目标变量,k=1,2,3,…,n,表示影响因素,n为影响因素总个数,xk(t)表示第k个变量对应的完整时间序列的第t个样本数据,Δxk(t)表示第k个变量对应的完整时间序列的第t+1个样本数据和第t个样本数据的差值;(3.2)、计算第j个影响因素与目标变量的关联系数δij(t):
【专利技术属性】
技术研发人员:邹见效,向伟,凡时财,徐红兵,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。