一种时序网络节点挖掘方法和系统技术方案

技术编号:35470211 阅读:17 留言:0更新日期:2022-11-05 16:15
本申请实施例公开了一种时序网络节点挖掘方法和系统,所述方法包括:基于设定时间窗口对待挖掘的时序数据进行切片,生成切片网络集合;分别计算所述切片网络集合的每个切片网络的网络结构属性信息,所述网络结构属性信息包括切片网络的连通率和节点K值;根据每个切片网络的连通率和节点K值计算得到每个切片网络的各节点的自适应K值;根据各节点的自适应K值确定节点的重要性分数值。避免因单个切片网络的波动对整体评估时造成过大的扰动,融合切片网络间结构作用的连贯性,更充分地评估网络中各节点的重要性分数值,高效准确的挖掘时序网络的重要节点。网络的重要节点。网络的重要节点。

【技术实现步骤摘要】
一种时序网络节点挖掘方法和系统


[0001]本申请实施例涉及信息处理
,具体涉及一种时序网络节点挖掘方法和系统。

技术介绍

[0002]网络结构存在于社会生活中的方方面面中,如网络社交平台,道路交通网络,电网网络和病毒传播网络等。在对网络进行分析时,传统网络分析方法主要是基于收集的数据建立静态网络进行分析,静态网络结构简单便于理解和解释,但是对时序数据而言缺少展示时序信息的维度,无法满足动态分析要求。例如市内交通网络,以静态网络进行分析适用于寻找两点间的路径信息,无法区分高峰期和非高峰期的车流量信息的差异,而如果能够结合上时序数据,就能够关注不同时段交通流量以及线路拥堵情况,从而能够合理的调控路口红绿灯以及配置交通协管员,以确保道路通畅,提高通行效率。
[0003]时序网络由于添加时序信息,所以需要更加复杂的结构来承载时序信息,并在对网络进行分析时需要设计合理方法从更高的维度对时序网络进行挖掘。现有技术采用固定时间窗口大小的切片网络结构对时序网络进行动态描述,计算出各切片网络中的节点的指标值,然后把节点指标值取均值处理。这种方式虽然包含时序信息,但是把各切片网络独立分析,忽视了单个切片网络的结构对所计算指标的影响情况,同时未考虑相邻切片网络间结构信息的相互影响的作用。

技术实现思路

[0004]为此,本申请实施例提供一种时序网络节点挖掘方法和系统,避免因单个切片网络的波动对整体评估时造成过大的扰动,融合切片网络间结构作用的连贯性,更充分地评估网络中各节点的重要性分数值,高效准确的挖掘时序网络的重要节点。
[0005]为了实现上述目的,本申请实施例提供如下技术方案:
[0006]根据本申请实施例的第一方面,提供了一种时序网络节点挖掘方法,所述方法包括:
[0007]基于设定时间窗口对待挖掘的时序数据进行切片,生成切片网络集合;
[0008]分别计算所述切片网络集合的每个切片网络的网络结构属性信息,所述网络结构属性信息包括网络连通率和节点K值;
[0009]根据每个切片网络的连通率和节点K值计算得到每个切片网络的各节点的自适应K值;
[0010]根据各节点的自适应K值确定挖掘节点。
[0011]可选地,所述根据每个切片网络的连通率和节点K值计算得到每个切片网络的各节点的自适应K值,包括:
[0012]根据每个切片网络的最大连通片得到每个切片网络的连通率结果集;
[0013]根据每个切片网络的连通率结果集、每个节点的节点K值确定每个切片网络的各
节点的自适应K值。
[0014]可选地,所述根据每个切片网络的连通率结果集、每个节点的节点K值确定每个切片网络的各节点的自适应K值,根据如下公式计算:
[0015][0016]其中,AK
i
表示节点i的自适应K值,K
ti
表示第t个切片网络中第i个节点的K值,W
t
=αCR
t
‑1+βCR
t
表示第t个切片网络的影响因子,CR
t
表示第t个切片网络的连通率,α和β为超级参数。
[0017]可选地,所述分别计算所述切片网络集合的每个切片网络的节点K值,包括:
[0018]针对每个切片网络,移除切片网络中所有度值小于等于设定索引值的节点以及与这些节点相连的边,重复操作直到切片网络的所有节点的度值都大于设定索引值,将所有移除的节点的节点K值赋值为设定索引值;
[0019]将设定索引值加一后重复上述操作,直到切片网络中所有节点被移除,以使得所有节点都有对应的节点K值。
[0020]可选地,所述基于设定时间窗口对待挖掘的时序数据进行切片,生成切片网络集合,包括:
[0021]获取待挖掘的时序数据;
[0022]根据设定时间窗口类型和设定时间窗口大小对所述待挖掘的时序数据进行切片处理,得到第一数目个切片网络,其中节点有所述第一数目个。
[0023]根据本申请实施例的第二方面,提供了一种时序网络节点挖掘系统,所述系统包括:
[0024]切片网络生成模块,用于基于设定时间窗口对待挖掘的时序数据进行切片,生成切片网络集合;
[0025]网络结构属性计算模块,用于分别计算所述切片网络集合的每个切片网络的网络结构属性信息,所述网络结构属性信息包括切片网络的连通率和节点K值;
[0026]自适应K值模块,用于根据每个切片网络的连通率和节点K值计算得到每个切片网络的各节点的自适应K值;
[0027]挖掘节点确定模块,用于根据各节点的自适应K值确定挖掘节点。
[0028]可选地,所述自适应K值模块,具体用于:
[0029]根据每个切片网络的最大连通片得到每个切片网络的连通率结果集;
[0030]根据每个切片网络的连通率结果集、每个节点的节点K值确定每个切片网络的各节点的自适应K值。
[0031]可选地,所述网络结构属性计算模块,具体用于:
[0032]针对每个切片网络,移除切片网络中所有度值小于等于设定索引值的节点以及与这些节点相连的边,重复操作直到切片网络的所有节点的度值都大于设定索引值,将所有移除的节点的节点K值赋值为设定索引值;
[0033]将设定索引值加一后重复上述操作,直到切片网络中所有节点被移除,以使得所有节点都有对应的节点K值。
[0034]根据本申请实施例的第三方面,提供了一种电子设备,包括:存储器、处理器及存
储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现上述第一方面所述的方法。
[0035]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述第一方面所述的方法。
[0036]综上所述,本申请实施例提供了一种时序网络节点挖掘方法和系统,通过基于设定时间窗口对待挖掘的时序数据进行切片,生成切片网络集合;分别计算所述切片网络集合的每个切片网络的网络结构属性信息,所述网络结构属性信息包括切片网络的连通率和节点K值;根据每个切片网络的连通率和节点K值计算得到每个切片网络的各节点的自适应K值;根据各节点的自适应K值确定节点重要性分数值。避免因单个切片网络的波动对整体评估时造成过大的扰动,融合切片网络间结构作用的连贯性,更充分地评估网络中各节点的重要性分数值,高效准确的挖掘时序网络的重要节点。
附图说明
[0037]为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
[0038]本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时序网络节点挖掘方法,其特征在于,所述方法包括:基于设定时间窗口对待挖掘的时序数据进行切片,生成切片网络集合;分别计算所述切片网络集合的每个切片网络的网络结构属性信息,所述网络结构属性信息包括切片网络的连通率和节点K值;根据每个切片网络的连通率和节点K值计算得到每个切片网络的各节点的自适应K值;根据各节点的自适应K值确定挖掘节点。2.如权利要求1所述的方法,其特征在于,所述根据每个切片网络的连通率和节点K值计算得到每个切片网络的各节点的自适应K值,包括:根据每个切片网络的最大连通片得到每个切片网络的连通率结果集;根据每个切片网络的连通率结果集、每个节点的节点K值确定每个切片网络的各节点的自适应K值。3.如权利要求2所述的方法,其特征在于,所述根据每个切片网络的连通率结果集、每个节点的节点K值确定每个切片网络的各节点的自适应K值,根据如下公式计算:其中,AK
i
表示节点i的自适应K值,K
ti
表示第t个切片网络中第i个节点的K值,W
t
=αCR
t
‑1+βCR
t
表示第t个切片网络的影响因子,CR
t
表示第t个切片网络的连通率,α和β为超级参数。4.如权利要求1所述的方法,其特征在于,所述分别计算所述切片网络集合的每个切片网络的节点K值,包括:针对每个切片网络,移除切片网络中所有度值小于等于设定索引值的节点以及与这些节点相连的边,重复操作直到切片网络的所有节点的度值都大于设定索引值,将所有移除的节点的节点K值赋值为设定索引值;将设定索引值加一后重复上述操作,直到切片网络中所有节点被移除,以使得所有节点都有对应的节点K值。5.如权利要求1所述的方法,其特征在于,所述基于设定时间窗口对待挖掘的时序数据进行...

【专利技术属性】
技术研发人员:叶章辉李青李鹏飞
申请(专利权)人:浙江省北大信息技术高等研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1