System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种信息的传播图生成方法与装置制造方法及图纸_技高网

一种信息的传播图生成方法与装置制造方法及图纸

技术编号:40242156 阅读:6 留言:0更新日期:2024-02-02 22:39
本发明专利技术提供一种信息的传播图生成方法与装置。该方法包括:收集传播数据;根据传播数据构建有向无环图;将非重要用户从构建的所述有向无环图中进行剪枝处理,得到剪枝处理后移除非重要用户的有向无环图;对有向无环图上的所有用户按照重要性进行排序,对应得到一个用户索引序列,并根据用户索引序列构建邻接矩阵;根据邻接矩阵训练图传播模型,得到训练好的图传播模型;将新的传播数据输入训练好的图传播模型,得到该新的传播数据对应的传播图。本发明专利技术提高了图传播模型的训练效率和精度。

【技术实现步骤摘要】

本专利技术涉及信息传播,尤其涉及一种信息的传播图生成方法与装置


技术介绍

1、在当今数字时代,信息传播非常广泛和迅速。为了更好地理解和分析这些信息的传播过程,研究信息在用户间的传播方式变得至关重要。目前,信息系统上的信息扩散经常被建模为在一个传播网络上的随机过程,而传播网络的拓扑结构是由节点和边构成的复杂网络,节点通常代表个体或实体,边代表它们之间的传播关系,即信息传播的真实路径。同时,对于许多下游任务,例如信息传播源定位和不实信息检测等需要大量传播网络的拓扑结构作为训练集,以数据作为驱动挖掘潜在的传播模式。但在现实场景中,监测和获取真实的传播网络结构需要耗费大量的资源,从而使得获取的数据数量和规模都相对较小。然而,使用规模小的数据集进行训练可能会导致限制模型的泛化能力、增加过拟合的风险以及降低模型的鲁棒性等弊端。此外,由于隐私和安全问题,获取公开可用的真实传播网络数据也变得越来越困难。为了解决这一困难,通过模拟和仿真信息传播的过程,进而产生贴近现实的传播网络拓扑是传播图生成方法的目标。

2、目前,传播图生成的方法主要分为两大类,分别为基于信息传播模型的仿真方法以及基于深度学习的图生成方法。然而,无论是哪种方法,目前生成传播图的方法,其生成精度较低,生成规模较小,生成速度较慢,且不包含用户的特征信息,进而导致生成的传播图的应用场景比较局限。


技术实现思路

1、本专利技术提供一种信息系统驱动的传播图与装置,用以解决现有技术中传播图的生成效率和精度都不够高的缺陷。

2、本专利技术提供一种信息的传播图生成方法,包括:

3、s1:收集传播数据,所述传播数据包括用户、用户特征、以及用户之间的传播关系;

4、s2:根据所述传播数据构建有向无环图g,g=(v,e,f)并初始化;其中,v表示用户集合,e表示用户之间的传播关系集合,f表示用户特征;

5、s3:将非重要用户从构建的所述有向无环图g中进行剪枝处理,得到剪枝处理后移除非重要用户的有向无环图g’;所述非重要用户为仅从传播源接收信息且不再转发的用户;

6、s4:使用广度优先搜索bfs,对所述有向无环图g’上的所有用户按照重要性进行排序,对应得到一个用户索引序列,并根据所述用户索引序列构建邻接矩阵;

7、s5:根据所述邻接矩阵训练图传播模型,得到训练好的图传播模型;

8、s6:将新的传播数据输入所述训练好的图传播模型,得到该新的传播数据对应的传播图。

9、根据本专利技术提供的一种信息的传播图生成方法,所述步骤s3包括:

10、步骤31:从所述传播数据中抽出一部分传播数据,并确定该一部分传播数据中的非重要用户;

11、步骤32:根据所述抽出的非重要用户训练非重要用户预测模型,得到训练好的非重要用户预测模型;

12、步骤33:将所述传播数据中剩余的传播数据输入所述训练好的非重要用户预测模型,预测得到对应的非重要用户;

13、步骤34:将所有非重要用户从所述有向无环图g中剔除,得到剔除非重要用户后的有向无环图,即所述剪枝处理后的有向无环图g’。

14、根据本专利技术提供的一种信息的传播图生成方法,步骤32包括:

15、采用以下模型训练非重要用户预测模型:

16、

17、

18、其中,pooling(·)为采用set2set模型对所述有向无环图网络g进行编码,nonlinear(·)为非线性模型;g表示传播网络的有向无环图,完整形式是g=(v,e,f),其中v表示用户集合,e表示用户之间的传播关系集合,f表示用户特征;fθ(g)表示根据传播网络的有向无环图g预测该图的非重要用户数量;表示非重要用户的数量;表示和非重要用户直接相连的关系边。

19、根据本专利技术提供的一种信息的传播图生成方法,所述步骤s4包括:

20、s41:获取所述有向无环图g’上的所有用户分别对应的用户特征,所述用户特征包括:用户的粉丝数、用户的帖子转发量,用户的关注数,用户的注册时间,用户是否认证;

21、s42:对每个用户的特征维度进行归一化,得到归一化后的特征维度;

22、s43:将每个用户的特征维度利用卡方分布按照重要性进行排序,得到每个用户排序后的特征维度和每个特征对应的权重;

23、s44:根据所述每个用户排序后的特征维度和对应的权重,确定所有用户的重要性i(v);

24、s45:根据所有用户的重要性i(v),确定所述用户索引序列。

25、根据本专利技术提供的一种信息的传播图生成方法,所述步骤s5包括:

26、根据如下公式训练图传播模型:

27、

28、

29、其中,fg为图级生成模型,fe为边级生成模型,hi为当前生成的有向无环图对应的序列模型在第i个中间层的隐含向量;f为当前生成的有向无环图对应的用户特征;为邻接矩阵在第i行对应的用户vi的邻接概率信息,表示对所述进行独热解码,的最大值为1,其他值设置为0;hi+1为根据当前生成的有向无环图生成的下一有向无环图对应的低维向量。

30、根据本专利技术提供的一种信息的传播图生成方法,所述图级生成模型fg采用以下公式训练得到:

31、logqφ(z|gru(x(k)))=logexp(z;λ(k))

32、其中,z是当前有向无环图的低维编码向量hi基于变分自编码器的潜在变量,gru作为时间序列处理模型,从输入的最新用户和其邻居的关系信息作为条件来确定潜在变量z的指数形式的参数;qφ(z|gru(x(k)))表示由φ参数化的潜在变量z的近似后验分布;λ(k)是指数分布的速率参数,logexp(z;λ(k))表示速率参数为λ(k)的指数分布的概率密度函数的自然对数;x(k)为转置邻接矩阵的第k行。

33、根据本专利技术提供的一种信息的传播图生成方法,所述边级生成模型fe采用以下公式训练得到:

34、qm=σ(wq•querym+bq)

35、

36、

37、likelihoodmn=scoremn·valuen

38、其中,querym表示在前生成的有向无环图对应的新用户m的综合特征信息,该综合特征信息由新用户的特征信息fm和该有向无环图对应的低维向量hi合成,querym=cat(fm,hi);keyn表示历史用户n的特征信息;socremn表示历史用户n和当前用户m在属性上的匹配程度;likelihoodmn表示历史用户n和当前用户m之间存在传播关系的可能性;wq、bq、wk、bk是模型在训练过程中学习的参数;qm表示新用户m的综合特征信息querym在线性变换权重参数wq和偏置参数bg的线性变换输出结果;kn表示历史用户n的特征信息在线性变换权重参数wk和偏置参数bk的线性变换输出结果;valuen表示第n个位置为1,其他位置为0,长度本文档来自技高网...

【技术保护点】

1.一种信息的传播图生成方法,其特征在于,包括

2.根据权利要求1所述的信息的传播图生成方法,其特征在于,所述步骤S3包括:

3.根据权利要求2所述的信息的传播图生成方法,其特征在于,步骤32包括:

4.根据权利要求1所述的信息的传播图生成方法,其特征在于,所述步骤S4包括:

5.根据权利要求1所述的信息的传播图生成方法,其特征在于,所述步骤S5包括:

6.根据权利要求5所述的信息的传播图生成方法,其特征在于,所述图级生成模型fG采用以下公式训练得到:

7.根据权利要求5所述的信息的传播图生成方法,其特征在于,所述边级生成模型fE采用以下公式训练得到:

8.根据权利要求5所述的信息的传播图生成方法,其特征在于,所述图传播模型基于以下损失函数训练得到:

9.一种信息的传播图生成装置,其特征在于,包括

【技术特征摘要】

1.一种信息的传播图生成方法,其特征在于,包括

2.根据权利要求1所述的信息的传播图生成方法,其特征在于,所述步骤s3包括:

3.根据权利要求2所述的信息的传播图生成方法,其特征在于,步骤32包括:

4.根据权利要求1所述的信息的传播图生成方法,其特征在于,所述步骤s4包括:

5.根据权利要求1所述的信息的传播图生成方法,其特征在于,所述步骤s5包括:...

【专利技术属性】
技术研发人员:王震侯东鹏王宇辰高超李向华李学龙
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1