一种基于时间序列分析的网络拓扑推断方法及装置制造方法及图纸

技术编号:30334955 阅读:17 留言:0更新日期:2021-10-10 01:00
本发明专利技术提供一种基于时间序列分析的网络拓扑推断方法及装置,所述方法包括:获取信息数据,将所述信息数据以时间序列进行表征;根据表征结果,对各节点进行排序,并按照排序次序将各节点对应的时间序列进行拼接;对拼接后的时间序列进行分段近似聚合;使用格拉姆角差场算法对分段近似聚合后的时间序列进行编码,构建类格拉姆矩阵;根据所述类格拉姆矩阵,对网络进行拓扑推断。根据本发明专利技术的方案,基于时间序列分析的网络拓扑推断方法可有效完成非协作条件下的拓扑推断。协作条件下的拓扑推断。协作条件下的拓扑推断。

【技术实现步骤摘要】
一种基于时间序列分析的网络拓扑推断方法及装置


[0001]本专利技术涉及计算机网络领域,尤其涉及一种基于时间序列分析的网络拓扑推断方法与装置。

技术介绍

[0002]网络拓扑是信息传输过程中需遵循的地图,为了实现网络中关键节点的识别、网络性能的监控以及网络特征的分析等均需要了解网络的拓扑结构。现有的拓扑推断方法主要分为协作式拓扑推断和非协作式拓扑推断两类,目前相关研究成果主要集中于协作式拓扑推断。
[0003]协作式拓扑推断方法,主要基于网络可接入、报文可解析的前提,通过对网络中传输信息的解析实现网络拓扑的推断,分为基于网络层析成像的推断方法和基于协议分析的推断方法。
[0004]基于网络层析成像的网络拓扑推断通常包括三个步骤:(1)使用端到端的测量方法获取端到端的相关性能参数;(2)利用端到端相关参数计算节点之间的关联性;(3)根据节点之间的关联性对网络的拓扑结构进行推断。针对节点相关性进行计算时依据的参数包括:传输成功率、排队时延、时延协方差、时延抖动协方差以及对多个参数融合后的综合参数等。网络层析成像技术按照探测包的发送方式分为主动测量和被动测量两类。主动测量主要是通过在选定节点上主动发送探测包,并根据采集到的相关信息对网络进行推断,方法主要包括单播测量和多播测量。主动测量的优势是主动发包,测量过程可控,使用灵活;其不足是发送的探测包会增加网络负担,对网络中正常数据的传输产生一定的影响。被动测量是通过对网络中的链路或者设备进行监测,根据网络中特定类型的数据包进行分析完成推断的方法。被动测量的优点是不需要主动发送数据包,不会对网络中正常传输的信息产生影响,不足是需要部署一定数量的监测设备,采用被动状态,有时无法监测到相关信息,监测时间相对较长,同时当网络中出现故障时,无法找到故障的具体位置,由于被动测量需要的监测设备较多,推断时间长,在实际的网络拓扑推断过程中应用较少。
[0005]基于协议分析的拓扑推断方法,首先针对不同的网络协议发送特定的探测包,进而在已接入节点(例如:网络汇聚节点)完成相关信息的采集,最终通过对不同报文的分析完成网络拓扑的推断。用于拓扑推断的协议主要包括简单网络管理协议(Simple Network Management Protocol, SNMP)、互联网控制报文协议(Internet Control Message Protocol, ICMP)、地址解析协议(Address Resolution Protocol, ARP)、网关协议(例如路由信息协议(Routing Information Protocol, RIP))、路由协议(例如开放最短路径优先协议(Open Shortest Path First Protocol, OSPF)和Ad Hoc 按需距离矢量路由(Ad hoc On

Demand Distance Vector Routing, AODV)协议)等。
[0006]协作式拓扑推断通常基于网络可接入、网络中通信信息可采集、可解析的前提,部分方法需要发送大量探测数据包才能完成推断,对于获取信息较少、网络不可接入的情况并不适用。
[0007]非协作式拓扑推断,主要在不接入、信息处于加密状态或者难以解析情况下实施,通常首先对监测到的频谱信号进行分析,构建信号对应的特征序列,然后采用格兰杰因果关系检验、传递熵分析等手段实现节点间通联关系或者网络拓扑的推断。
[0008]格兰杰因果关系检验最早由英国经济学家克莱夫

格兰杰提出,目的是为了实现对经济学上平稳时间序列数据的预测。在格兰杰因果关系推断过程中,如果一个变量X无助于预测另一变量Y,则说X不是Y的原因,如果X是Y的原因,需要满足两个条件:一是X有助于预测变量Y,二是Y无助于预测X。2013年,Paul Tilghman等人对非协作式拓扑推断进行了研究,并将格兰杰因果关系检验应用于无线通信链路和网络拓扑的推断,通过将两个信号对应的序列代入格兰杰因果计算公式求取的两个节点之间的格兰杰因果关系值,并与阈值进行比较,如果大于阈值则认定两个节点间存在通联关系,否则不存在。传递熵也基于格兰杰因果关系的定义,但是在实际应用过程中,它放宽了通常伴随格兰杰因果关系的线性自回归建模假设。2018年,Pranay Sharma等人针对基于格兰杰因果关系进行拓扑推断复杂度高的问题,提出了基于传递熵的拓扑推断方法。该方法同样基于ARQ机制中数据包与ACK之间的紧密关联性,假定每个节点有两个时间序列可用,分别是接收数据包的时间序列和接收ACK的时间序列,分析过程中仅捕捉信号的下降沿,将下降沿出现的时刻记为1,其余时刻记为0。将节点收到数据包建模为因,将收到ACK建模为果。在获取不同节点间时间序列的传递熵值得基础上,通过与阈值进行比较,如果传递熵值大于阈值则判定两个节点之间存在通联关系。
[0009]总结来看,协作式拓扑推断的相关方法无法应用于加密网络,已有的相关非协作式拓扑推断方法大多存在推断时间长,准确率对人为设定的阈值敏感的问题。

技术实现思路

[0010]为解决上述技术问题,本专利技术提出了一种基于时间序列分析的网络拓扑推断方法与装置,所述方法与装置,用以解决不接入网络、不解析信息内容情况下的拓扑推断的技术问题。
[0011]根据本专利技术的第一方面,提供一种基于时间序列分析的网络拓扑推断方法,所述方法包括以下步骤:步骤S101:获取信息数据,将所述信息数据以时间序列进行表征;步骤S102:根据表征结果,对各节点进行排序,并按照排序次序将各节点对应的时间序列进行拼接;步骤S103:对拼接后的时间序列进行分段近似聚合;步骤S104:使用格拉姆角差场算法对分段近似聚合后的时间序列进行编码,构建类格拉姆矩阵;步骤S105:根据所述类格拉姆矩阵,对网络进行拓扑推断。
[0012]根据本专利技术第二方面,提供一种基于时间序列分析的网络拓扑推断装置,所述装置包括:表征模块:配置为获取信息数据,将所述信息数据以时间序列进行表征;拼接模块:配置为根据表征结果,对各节点进行排序,并按照排序次序将各节点对应的时间序列进行拼接;
聚合模块:配置为对拼接后的时间序列进行分段近似聚合;编码模块:配置为使用格拉姆角差场算法对分段近似聚合后的时间序列进行编码,构建类格拉姆矩阵;拓扑推断模块:配置为根据所述类格拉姆矩阵,对网络进行拓扑推断。
[0013]根据本专利技术第三方面,提供一种基于时间序列分析的网络拓扑推断系统,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前所述的基于时间序列分析的网络拓扑推断方法。
[0014]根据本专利技术第四方面,提供一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于时间序列分析的网络拓扑推断方法。
[0015]根据本专利技术的上述方案,能够在不接入网络、不解析信息内容的情况下实现对网络拓扑的推断。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时间序列分析的网络拓扑推断方法,其特征在于,包括以下步骤:步骤S101:获取信息数据,将所述信息数据以时间序列进行表征;步骤S102:根据表征结果,对各节点进行排序,并按照排序次序将各节点对应的时间序列进行拼接;步骤S103:对拼接后的时间序列进行分段近似聚合;步骤S104:使用格拉姆角差场算法对分段近似聚合后的时间序列进行编码,构建类格拉姆矩阵;步骤S105:根据所述类格拉姆矩阵,对网络进行拓扑推断。2.如权利要求1所述的基于时间序列分析的网络拓扑推断方法,其特征在于,所述步骤S101:获取信息数据,将所述信息数据以时间序列进行表征,包括:获取信息数据,设定采样时间间隔,对所述信息数据进行分析,若在采样间隔内有信号发送,则该采样间隔对应的时间序列中的值为1,否则为0。3.如权利要求2所述的基于时间序列分析的网络拓扑推断方法,其特征在于,所述步骤S102:根据表征结果,对各节点进行排序,并按照排序次序将各节点对应的时间序列进行拼接,包括:所述信息数据的时间序列的表征方式是0和1组成的序列,将各节点首次出现1的时间进行比较,即按照1出现的时间对节点进行排序,1出现的早的节点排在前面;按照排序次序将各节点对应的时间序列进行拼接。4.如权利要求3所述的基于时间序列分析的网络拓扑推断方法,其特征在于,所述步骤S103:对拼接后的时间序列进行分段近似聚合,包括:对于一个包含n个观测值的时间序列T,T={t1,t2,

,t
n
},使用N
d
表示时间序列被处理后得到的最终维数;设定压缩率ψ用于表示原始时间序列的长度与其分段聚合后的长度之比,ψ的计算公式如下:(1)使用表示时间序列T压缩后得到的结果,T
ψ
中第r个元素对应的计算公式如下:(2)其中,t
j
为T中的第j个元素;在分段近似聚合的基础上,将T
ψ
中元素归一化到[

1,1]区间内,得到集合,,其中,为聚合结果归一化后集合中的第i个元素,的计算公式为:
ꢀꢀ
(3)为中第i个元素,max(T
ψ
)为T
ψ
中最大值,min(T
ψ
)为T
ψ
中最小值;步骤S104:使用格拉姆角差场算法对分段近似聚合后的时间序列进行编码,构建类格拉姆矩阵,包括:根据归一化的结果,将分段近似聚合后的时间序列从笛卡尔坐标系转换到极坐标系,将缩放后得到的数值编码为角度,且存在,将对应的时间戳t
i

编码为半径r
i
,坐标变换公式如下: (4)其中,t
i

是时间序列中第i个元素对应的时间戳,是对极坐标系统生成空间进行正则化的常数因子,为常数集合;利用格拉姆角差场算法对分段近似聚合后的时间序列进行编码构建类格拉姆矩阵,其计算公式如下:其中,G为编码得到的类格拉姆矩阵,为对应的角度值大小,为对应的角度值大小,是的平方操作,I是单位行向量[1,1,

,1],是的转置操作,为的转置向量;所述步骤S105:根据所述类格拉姆矩阵,对网络进行拓扑推断,包括:根据节点之间是否存在通联关系为不同节点对形成的类格拉姆矩阵增加标签,即节点对之间存在通联关系则其对应的标签为1,否则为0;在标签数据构建的基础上,使用K最近邻算法进行判定,使用余弦相似度来衡量样本之间的相似性,余弦相似度的计算公式为:(6)
其中P为已训练好模型中的一个序列,p
k
为P中第k个元素,P

为待判定序列,p

k
为P

中第k个元素;在样本相似度求取得基础上,根据样本相似性找出相似度最高的个训练样本作为待分类样本的个近邻,再根据个近邻采用投票策略实现对待分类样本类型的判定,判定待分类样本对应的两个节点之间是否存在通联关系,根据判定结果和节点位置信息完成拓扑推断结果的输出。5.一种基于时间序列分析的网络拓扑推断装置,其特征在于,所述装置包括:表征模块:配置为获取信息数据,将所述信息数据以时间序列进行表征;拼接模块:配置为根据表征结果,对各节点进行排序,并按照排序...

【专利技术属性】
技术研发人员:束妮娜马涛王晨牛钊汪明智刘春生常超李磊
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1