不确定时间序列之间的相似性的广义符号表示制造技术

技术编号:8456852 阅读:262 留言:0更新日期:2013-03-22 09:00
一种用于发现多个时间序列之间的距离的方法,其中多个时间序列中的每个个体时间序列包括数据,其中数据是不确定数据,该方法包括:从多个时间序列选择至少两个时间序列;计算在给定时刻的两个序列之间的第一差值;将第一差值与值表进行映射;使用值表来计算第二差值,其中第二差值是时间序列之间的相似性的测量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及标识多个时间序列之间的距离。
技术介绍
用于相似性搜索和数据挖掘的距离测量经常聚焦于不确定数据,比如从传感器网络产生的数据。然而,近来已经转向认识到在许多应用领域中应当捕获并且考虑这样的数据的不确定性。但是,没有许多方式应对时间序列或者流传输数据。通常,与时间序列中的不同时隙对应的值具有不同误差贡献。需要一种用于执行数据挖掘任务、比如时间序列聚类和分类的技术。常规距离度量无法对不确定数据有效。论文"A framework for clustering uncertain data streams" (C. C. Aggarwal 和P.S.Yu,2008)提出一种用于对不确定数据流聚类的框架。该论文假设已知关于不确定性的一些统计量。基于这一点而创建微聚类,并且在新数据点到来时基于预计相似性值来动态更新微聚类。这一方式因此不适用于一般数据挖掘任务。论文〃 Probabilistic similarity search for uncertain time series" (J. Aβ falg、H. Kriegel, P.Krger 和 M. Renz. , SSDBM本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:S·R·萨朗吉K·穆尔蒂
申请(专利权)人:国际商业机器公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1