【技术实现步骤摘要】
一种离散时序数据的非稳态性格兰杰因果关系挖掘方法
本专利技术涉及数据挖掘
,尤其涉及一种离散时序数据的非稳态性格兰杰因果关系挖掘方法。
技术介绍
随着社会进步和科技发展,人们需要认识的事物变得越来越复杂,系统内部的因果关系是客观存在的,因果发现就是从数据中挖掘其蕴含的因果关系,从而帮助人们认识事物间的客观规律,而格兰杰因果关系Xt-1→Yt可以用于预测事件的发生。例如在电视节目推荐系统的设计中,如果有两个时序数据Xt-1人们在t-1时刻收看体育节目和Yt人们在t时刻收看娱乐节目我们的学习到Xt-1→Yt这个关系,既我们可以得出结论人们倾向于在看完体育节目X后接着看娱乐节目,因此再电视节目推荐系统中,电视台可以把娱乐节目安排在体育节目后,以让电视台达到增加收视率的效果。在目前的研究中,基于霍克斯点过程(HawkesPointProcess)的格兰杰因果关系(GrangerCausality)发现方法在离散时序数据上起到了比较好的效果。该方法通过点过程与霍克斯过程的结合发现了变量之间在时间维度上存在的因果关系,但是 ...
【技术保护点】
1.一种离散时序数据的非稳态性格兰杰因果关系挖掘方法,基于霍克斯点过程,其特征在于,包括以下步骤:/nS1.获取时空序列数据集并建立霍克斯模型,初始化所述霍克斯模型并对时间序列标注类别标签;/nS2.根据标注的类别标签情况,通过Hawkes-EM算法学习各类别数据对应的霍克斯模型参数以及格兰杰因果关系,基于贪婪算法优化对时空序列数据的类别划分;/nS3.根据步骤S2所述时空序列数据的类别划分以及学习得到的霍克斯模型参数,计算所述霍克斯模型的最终评分;/nS4.重复步骤S2和S3,直至最终评分值满足预设标准,则此时霍克斯模型参数对应的述时空序列数据的类别划分情况及对应类别挖掘 ...
【技术特征摘要】
1.一种离散时序数据的非稳态性格兰杰因果关系挖掘方法,基于霍克斯点过程,其特征在于,包括以下步骤:
S1.获取时空序列数据集并建立霍克斯模型,初始化所述霍克斯模型并对时间序列标注类别标签;
S2.根据标注的类别标签情况,通过Hawkes-EM算法学习各类别数据对应的霍克斯模型参数以及格兰杰因果关系,基于贪婪算法优化对时空序列数据的类别划分;
S3.根据步骤S2所述时空序列数据的类别划分以及学习得到的霍克斯模型参数,计算所述霍克斯模型的最终评分;
S4.重复步骤S2和S3,直至最终评分值满足预设标准,则此时霍克斯模型参数对应的述时空序列数据的类别划分情况及对应类别挖掘得到的格兰杰因果关系为最优解。
2.根据权利要求1所述的离散时序数据的非稳态性格兰杰因果关系挖掘方法,其特征在于,步骤S1所述的霍克斯模型的表达式为:
其中Nj(t-s)={Nj(t-s)|t-s∈[0,T]}表示t-s时刻之间j事件发生的次数;T表示考虑的最大时间长度;U表示模型考虑的变量个数;aij表示i变量和j变量之间的关系强度,若j对i有联系则aij>0,否则aij=0;k(t-s)是指数衰变函数;μu表示外源基础强度;表征其他变量对i变量的内源性强度;λi(t)为i变量在t时刻的强度,aij为j变量对i变量的格兰杰因果关系的体现,即aij>0则有jt-1→it。
3.根据权利要求2所述的离散时序数据的非稳态性格兰杰因果关系挖掘方法,其特征在于,步骤S1所述的初始化所述霍克斯模型并对时间序列标注类别标签具体为:对霍克斯模型表达式中的参数μu和aij初始化为[0,1]之间的随机数,并对时间序列的每个数据标注类别标签,其中t∈[0,T]的时间序列下共有K个类别,对时间序列的每个数据标注的类别标签值为[1,K]的其中一个。
4.根据权利要求3所述的离散时序数据的非稳态性格兰杰因果关系挖掘方法,其特征在于,所述步骤S2的具体步骤包括:
根据步骤S1标注的类别标签情况,对于其中每一类数据,根据以下方法完成学习得到属于每一类数据对应的模型参数μu和aij:
步骤S1所述...
【专利技术属性】
技术研发人员:蔡瑞初,陈济斌,温雯,郝志峰,梁智豪,乔杰,陈薇,陈炳丰,李梓健,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。