System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向天文光变曲线的时间序列异常检测方法及系统技术方案_技高网

面向天文光变曲线的时间序列异常检测方法及系统技术方案

技术编号:41362568 阅读:11 留言:0更新日期:2024-05-20 10:11
本发明专利技术公开了一种面向天文光变曲线的时间序列异常检测方法,包括如下步骤:建立时序重构子模型,对每个通道的单变量时间序列进行重构,重构结果拼接为时序重构矩阵,计算所述时序重构矩阵与所述光变曲线数据形成的原矩阵的重构误差;将重构误差作为以时间戳为滑动窗口的嵌入,计算每个窗口的重构误差中两两通道之间的相似度,推导出时间戳窗口对应的图结构;以图结构和原矩阵作为输入,通过图卷积神经网络进行二次重构,输出共现噪声矩阵,其中,无法被有效重构的通道判断为真实异常影响的天体实例。本发明专利技术通过在两个不同的模型中依次、分别利用单变量和多变量的时间序列建模技巧,分别应对通道独立性和共现噪声两个特性。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,具体是一种面向天文光变曲线的时间序列异常检测方法及系统


技术介绍

1、近年来,随着观测设备的发展,天文学的科学发现取得了重大进展。一方面,具有更高时间和空间分辨率的光学或射电望远镜促进了大规模天文数据的收集,包括光变曲线、光学图像和无线电信号等方面,从而为研究人员探索和解释自然世界提供了宝贵的资源。另一方面,通过对海量的观测数据进行自动化分析和解释,可以发现更多有价值的科学现象,例如,光变曲线的异常模式(即偏离正常模式)可能是潜在有价值的天体事件或物理现象。但鉴于海量的观测数据,很难从中筛选出异常数据,因此设计一种有效的异常检测方法以辅助从天文大数据中进行科学发现是至关重要的。

2、多个天体的光变曲线数据可以表示为多变量时间序列,但与一般的多变量时间序列相比,光变曲线具有两种独特性:1)通道独立性。由于多变量时间序列中的每个通道代表一个天体,它们之间有遥远的物理距离、不同的物理特性,因此,每个通道在本质上是独立的,在正常情况下不会相互影响。这一点与来自工业设备或it系统的一般多变量时间序列不同,因为一般的多变量时间序列往往表现出常态的通道依赖性。2)共现噪声。通过望远镜观测到的光变曲线很容易受到环境干扰,如云层遮挡或极端天气影响,这些因素可能会在同一时间段内同时影响不定数量天体的观测,我们称这种影响为共现噪声。

3、上述两种特性可以总结为:多条光变曲线在正常模式下是无关联的,但是可能受到具有关联的噪声干扰。然而,这种噪声并不对应于实际的天体事件,因此不应被识别为异常,否则就会引起大量误警。

4、由此可以看出现有的时间序列异常检测方法不能适应以上两种特征,如图1(a)所示,单变量时间序列异常检测方法会将共现噪声错误识别为天体事件,从而无法用于对天文光变曲线进行异常检测。而为了解决共现噪声的特性,需要将多条光变曲线联合视为多变量时间序列,从而建模多条光变曲线之间的共现噪声关联。然而,现有的多变量时间序列异常检测方法主要针对工业设备和城市基础设施等系统,实现的前提是假设所有通道之间通常相互依赖,但这样的假设与天体固有的通道独立性不符。因此,这些方法在应用于天文观测时性能欠佳。

5、最近的研究提出将多条光变曲线的每个通道视为一个节点,并应用图神经网络(gnn)来显式建模节点之间的依赖关系。虽然与传统的多变量时间序列建模方法相比,这些方法在捕获节点之间的依赖关系方面表现出了更优的性能,但在有效建模共现噪声方面仍然存在问题。具体地,现有的图神经网络可以显式地学习节点之间的依赖程度,包括全局静态图和动态时序图两种。然而,天文观测中的环境干扰具有不可预测性,导致共现噪声同时具有空间随机性和时间随机性,这表明天体之间缺乏稳定的依赖关系,缺乏可预测的、固定的时间演化模式。这种随机性不仅破坏了构建静态图的基本前提,也违背了构建动态图的核心原理。


技术实现思路

1、本专利技术提供一种将单变量与多变量的时间序列建模方式进行结合,针对具有共现噪声的天文光变曲线的时间序列异常检测方法及系统。

2、为解决上述技术问题,本专利技术首先提供一种面向天文光变曲线的时间序列异常检测模型的构建方法,包括如下步骤:

3、s100、获取包含多个天体的光变曲线数据,将所述光变曲线数据的子序列y的每个通道均视为独立的单变量时间序列,一个天体实例对应一个通道;

4、建立基于transformer架构的时序重构子模型,对每个通道的单变量时间序列进行重构,重构结果拼接为时序重构矩阵计算所述时序重构矩阵与所述光变曲线数据形成的原矩阵的重构误差;

5、在第一阶段,通过时序重构子模型对每个天体的正常时间模式进行建模,该模型使用基于transformer的编码器-解码器架构。根据通道独立性,通过共享网络将多个天体视为独立的单变量时间序列。

6、s200、将所述重构误差作为以时间戳为滑动窗口的嵌入,计算每个窗口的重构误差中两两通道之间的相似度,推导出时间戳窗口对应的图结构;

7、以所述图结构和所述原矩阵作为输入,通过基于图卷积神经网络架构的共现噪声重构子模型进行二次重构,输出共现噪声矩阵

8、在第二阶段考虑通道依赖性,通过共现噪声重构子模型重构,从异常候选体中进一步过滤掉共现噪声实例。鉴于共现噪声的空间和时间随机性,本专利技术通过简单有效的窗口级图结构学习技术,利用重构误差,为每个时间窗口生成一个不同的邻接矩阵,但并不进一步计算不同邻接矩阵之间的时序相关性。这种技术避免了gnn在以前的方法中学习静态的空间相关性或可预测的动态时间模式的前提假设,使模型可以更好地专注于捕获共现噪声,从而提高在天文观测中异常检测的有效性。

9、s300、对建立的两个子模型训练,得到异常检测模型。

10、本专利技术采用了一个两阶段的检测框架来解决现有的两类异常检测方法的局限性,包括时序重构和共现噪声重构,分别针对天文观测中的通道独立性和共现噪声两种不同特性而设计,本专利技术能够有效地重建正常时间模式和共现噪声,从而将真实异常筛选出来,与现有方法相比,本专利技术为天文观测数据量身定制的两阶段框架显著降低了实际应用中的假阳性数量。

11、本专利技术中,光变曲线数据生成两种类型的序列,一种是以窗口长度为w的天体实例,生成的序列x,写成x∈rn×w,n为通道数量;另一种为x的后半部分生成的子序列y,其窗口长度为ω,且ω<w,写成y∈rn×ω。这种方法确保了重建更专注于时间序列的后半部分,同时利用更长的上下文来更好地捕获时间模式。这一策略背后的原理与时间序列异常检测的推理阶段一致,其中使用滑动窗口逐步确定最后一个时间戳的异常分数。

12、本专利技术的步骤s100中将多个天体的光变曲线数据的每个通道视为独立的单变量时间序列,在对每个通道的单变量时间序列进行重构时,建立的所述时序重构子模型基于transformer的编码器-解码器架构;

13、其输入部分是将x和y的每个通道单独记为l(n)和s(n),再对l(n)和s(n)进行线性投影后与时间嵌入相加后形成。

14、标准的transformer利用位置编码将顺序信息整合到序列中,假设时间间隔相等。然而,这一假设不适用于天文光变曲线,因为光变曲的观测间隔并不严格相等。为了考虑不规则的间隔,本专利技术提出了一种改进的时间编码技术,上述时间嵌入不仅包含了原始三角函数中的绝对位置,而且将时间间隔编码为可学习的相移,最后将sin和cos项求和作为时间嵌入函数,时间嵌入tet在时间戳t上的第j维定义为:

15、

16、其中fj预定义的角频率,post为时间戳t的绝对位置,δt是当前时间戳与前一个时间戳的时间间隔,αj是可学习的参数;

17、所述时序重构子模型最终输入嵌入为:

18、

19、

20、分别使用ie和id来代表和上式中we、wd为可学习参数。

21、本专利技术所述时序重构子模型的编码器对长本文档来自技高网...

【技术保护点】

1.一种面向天文光变曲线的时间序列异常检测模型的构建方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的构建方法,其特征在于,光变曲线数据生成两种类型的序列,一种是窗口长度为W的天体实例生成的序列X,写成X∈RN×W,N为通道数量;另一种为X的后半部分生成的子序列Y,其窗口长度为ω,且ω<W,写成Y∈RN×ω。

3.根据权利要求2所述的构建方法,其特征在于,步骤S100中时序重构子模型的输入部分是将X和Y的每个通道单独记为L(n)和S(n),再对L(n)和S(n)进行线性投影后与时间嵌入相加后形成。

4.根据权利要求3所述的构建方法,其特征在于,所述时间嵌入包含了原始三角函数中的绝对位置,并将时间间隔编码为可学习的相移,最后将sin和cos项求和作为时间嵌入函数,时间嵌入TEt在时间戳t上的第j维定义为:

5.根据权利要求4所述的构建方法,其特征在于,所述时序重构子模型的编码器对长窗口的时间序列IE生成表示,该表示是基于Transformer架构中应用的注意力机制生成的,注意力机制执行以下操作:

6.根据权利要求2所述的构建方法,其特征在于,设定步骤S100计算获得的重构误差为E,时间戳t的滑动窗口的嵌入为Et,则步骤S200的具体步骤为:

7.一种面向天文光变曲线的时间序列异常检测方法,其特征在于,包括如下步骤:

8.一种面向天文光变曲线的时间序列异常检测系统,其特征在于,包括:

9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线;

10.一种非暂态计算机可读存储介质,其上存储有计算机指令,该计算机指令使计算机执行权利要求7所述面向天文光变曲线的时间序列异常检测方法。

...

【技术特征摘要】

1.一种面向天文光变曲线的时间序列异常检测模型的构建方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的构建方法,其特征在于,光变曲线数据生成两种类型的序列,一种是窗口长度为w的天体实例生成的序列x,写成x∈rn×w,n为通道数量;另一种为x的后半部分生成的子序列y,其窗口长度为ω,且ω<w,写成y∈rn×ω。

3.根据权利要求2所述的构建方法,其特征在于,步骤s100中时序重构子模型的输入部分是将x和y的每个通道单独记为l(n)和s(n),再对l(n)和s(n)进行线性投影后与时间嵌入相加后形成。

4.根据权利要求3所述的构建方法,其特征在于,所述时间嵌入包含了原始三角函数中的绝对位置,并将时间间隔编码为可学习的相移,最后将sin和cos项求和作为时间嵌入函数,时间嵌入tet在时间戳t上的第j维定义为:

【专利技术属性】
技术研发人员:孟小峰郝新丽马超红
申请(专利权)人:中国人民大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1