当前位置: 首页 > 专利查询>河海大学专利>正文

一种多度量时间序列相似分析方法技术

技术编号:9668053 阅读:159 留言:0更新日期:2014-02-14 06:37
本发明专利技术公开一种多度量时间序列相似分析方法,适用于时间序列的k-近邻查询。根据分析需求选择多个单一相似度量方法,分别利用各单一相似度量分析查询序列的m-近邻序列或子序列;对各相似度量下的m-近邻序列或子序列进行修剪,得到候选相似序列或子序列;利用带优势权重的多分类器组合法对候选相似序列或子序列进行组合得到查询序列的k-近邻序列。相对于单一相似度量,多度量组合的相似分析能够得到更加全面的分析结果。带优势权重的多分类器组合法在借鉴BORDA计数法的同时,利用相邻候选相似序列或子序列与查询序列的相似距离的差异对排序得分进行调整,以反映候选相似序列或子序列相似的具体差异。

【技术实现步骤摘要】

本专利技术涉及,尤其是能够进行多度量组合的k-近邻相似时间序列分析的方法,属于数据挖掘

技术介绍
时间序列相似性查找就是在时间序列数据库中查找和发现与给定模式相似的时间序列,查找相似子序列的过程在实际问题中经常遇到,例如,在人类的基因组计划中,从DNA基因序列中查找出与给定的基因片段相似的子片段,根据遗传的相似性进行研究;根据各种商品的销售记录,找出具有相似的商品销售模式,根据相似产品的销售模式来制定相似的销售策略等;找出自然灾害发生的相同前兆,从而对预报自然灾害进行决策研究;在水文领域,找出与当前洪水过程相似的历史洪水过程,回答防汛指挥中经常会想到的“当前水文过程与历史上哪一时期的水文过程类似”等问题。相似性搜索在1993年由R.Agrawal首次提出,他是时间序列预测、分类、聚类以及序列模式挖掘等等的重要基础。时间序列相似性查找与传统的精确查询不同,由于时间序列在数值上具有连续性以及有不同的噪声影响,因此,大部分情况下不需要时间序列很精确匹配。另一方面是时间序列相似性查询不是针对时间序列中的某个具体的数值,而根据给定的查询序列来找查找是在一段时间内具有相似本文档来自技高网...

【技术保护点】
一种多度量时间序列相似性分析方法,适用于时间序列的k?近邻查询,其特征在于,所述方法包括以下步骤:根据分析需求选择多种单一相似度量作为基分类器;对待查询时间序列按照所选择的单一相似度量的需要提取特征,建立索引;利用各单一相似度量对待查序列进行相似性分析,得到查询序列的m?近邻时间序列;对各单一相似度量下的m?近邻时间序列进行修剪,得到候选相似序列或子序列;利用带优势权重的多分类器组合法对候选相似序列或子序列进行组合得到最终的k?近邻时间序列。

【技术特征摘要】
1.一种多度量时间序列相似性分析方法,适用于时间序列的k-近邻查询,其特征在于,所述方法包括以下步骤: 根据分析需求选择多种单一相似度量作为基分类器; 对待查询时间序列按照所选择的单一相似度量的需要提取特征,建立索引; 利用各单一相似度量对待查序列进行相似性分析,得到查询序列的m-近邻时间序列; 对各单一相似度量下的m-近邻时间序列进行修剪,得到候选相似序列或子序列; 利用带优势权重的多分类器组合法对候选相似序列或子序列进行组合得到最终的k-近邻时间序列。2.根据权利要求1所述的多度量时间序列相似性分析方法,其特征在于,作为基分类器的各单一相似度量是根据分析的需求从已有的相似度量中由用户选择;各单一相似度量都将待查序列分为第I相似序列、第2相似序列、…、第m相似序列以及不相似序列这样的m+1 类。3.根据权利要求1所述的多度量时间序列相似性分析方法,其特征在于,每个单一相似度量的分析步骤具体为:提取时间序列特征,建立时间序列索引,运用时间序列相似性搜索方法,结合相似度量,检索m-近邻时间序列,m取值略大于k。4.根据权利要求1所述的多度量时间序列相似性分析方法,其特征在于,对各单一相似度量下的m-近邻序列进行修剪的步骤具体为:将各单一相似度量的m-近邻序列按照时间顺序排列,对各单一相似度量的相似序列之间交叉超过序列长度一半的序列进行修剪,修剪方法为,选择新的时间序列代替交叉的序列,新序列的起点为交叉序列的起点时间的...

【专利技术属性】
技术研发人员:王继民朱跃龙李士进万定生冯钧
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1