【技术实现步骤摘要】
一种多元时间序列相似性检索方法
[0001]本专利技术涉及信息处理
,特别是涉及一种多元时间序列相似性检索方法。
技术介绍
[0002]时间序列的相似性搜索,是根据给定的查询目标在时间序列候选数据中正确、快速查找到符合要求的数据,是时间序列挖掘领域一项重要工作。在实际生活中,多元时间序列相似性搜索可直接应用于各类场景,如基于每日最高、最低价寻找走势相似的股票,根据传感集群数据查找相似行为的目标,以及根据心、脑电图搜寻相似病情的患者。在理论研究中,它是时间序列分类、聚类的一项子流程,也是时间序列异常检测的一种有效途径,可以说,时间序列相似性搜索是时间序列数据挖掘领域一项重要的基础性工作,不仅具有很高的理论意义,也有广泛的应用价值。
[0003]随着信息化技术的广泛应用,以及物联网技术的蓬勃发展,时间序列呈多元化的发展趋势,给相似性搜索工作带来极大挑战,主要体现为:
①
由于多元变量之间存在复杂的相关性,以及现有多元时间序列数据普遍缺少先验信息的数据现状,对多元时间序列相似性进行精确度量的难度较大;
【技术保护点】
【技术特征摘要】
1.一种多元时间序列相似性检索方法,其特征在于,包括以下步骤:采集原始多元时间序列MTS数据,其中,所述多元时间序列MTS数据为每个时刻同时对多个指标进行观测、记录形成的数据;提取所述原始多元时间序列MTS数据中的特征向量;对所述特征向量进行映射,获得所述特征向量对应的标量;基于所述标量的大小排序,重新建立所述原始多元时间序列MTS数据在磁盘内的存储索引,获得存储位置;构建学习索引模型,利用所述标量和所述存储位置训练所述学习索引模型,获得训练好的学习索引模型;将待查询数据的标量输入所述训练好的学习索引模型,输出相邻的k个所述原始多元时间序列MTS数据。2.根据权利要求1所述的多元时间序列相似性检索方法,其特征在于,提取所述原始多元时间序列MTS数据中的特征向量包括:基于所述原始多元时间序列MTS数据构造训练样本;构建特征向量提取模型,利用所述训练样本训练所述特征向量提取模型;利用所训练好的所述特征向量提取模型提取所述原始多元时间序列MTS数据中的特征向量。3.根据权利要求2所述的多元时间序列相似性检索方法,其特征在于,所述训练样本包括锚点、正样本和负样本。4.根据权利要求3所述的多元时间序列相似性检索方法,其特征在于,在利用所述训练样本训练所述特征向量提取模型的过程中,根据所述特征向量提取模型的训练自行调整正负样本的选取策略。5.根据权利要求2所述的多元时间序列相似性检索方法,其特征在于...
【专利技术属性】
技术研发人员:王翔,邓文,黄知涛,李保国,徐强,刘世雄,孙丽婷,柯达,王丰华,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。