基于用户依赖关系的社交网络转发行为预测方法及装置制造方法及图纸

技术编号:37123956 阅读:16 留言:0更新日期:2023-04-01 05:20
本发明专利技术实施例公开了一种基于用户依赖关系的社交网络转发行为预测方法及装置,方法包括:根据用户社交关系确定用户群体,得到用户群体中各用户的第一嵌入向量;根据转发过程以及用户的第一嵌入向量,计算得到包含上下文依赖向量的用户的第二嵌入向量;根据用户的第二嵌入向量以及预设方向掩码,基于自注意力机制,按照用户转发文本内容的顺序进行跨层连接及归一化处理,得到转发过程的转发用户序列嵌入;根据文本内容,确定文本内容的转发文本嵌入向量;根据文本内容的转发文本嵌入向量以及转发用户序列嵌入,计算得到转发用户序列嵌入对文本内容的注意力结果,根据注意力结果得到用户转发文本内容的预测概率。用户转发文本内容的预测概率。用户转发文本内容的预测概率。

【技术实现步骤摘要】
基于用户依赖关系的社交网络转发行为预测方法及装置


[0001]本专利技术实施例涉及社交网络应用
,具体涉及一种基于用户依赖关系的社交网络转发行为预测方法及装置。

技术介绍

[0002]随着互联网和Web2.0技术的迅速发展和普及,互联网上出现了大量在线社交网络,它们已经成为人们分享、传播和获取信息的主要平台。媒体可以在平台上发布内容,同时也有大量用户通过点赞、转发等行为加速内容的传播过程。
[0003]现有技术对内容扩散的研究主要在于理解内容的传播机制,对进行商业推广、社会热点追踪和敏感内容监控等具有重要意义。通过分析内容传播的特征,可以调节内容的传播范围,影响传播的用户群体或者避免内容的快速传播。
[0004]目前关于内容转发行为的预测大多依赖RNN(Recurrent Neural Network,循环神经网络)模型来提取已经观测到的转发过程的特征,但RNN模型认为序列的下一个数据受其直接前驱节点的影响,间距越长,影响关系越弱,而这种处理方式与内容的传播过程相悖。且现有的模型大多认为内容的传播仅依靠用户之间的影响关系进行,而忽略了内容本身的特征、用户之间的好友关系特征、用户的属性特征等对内容传播的影响。

技术实现思路

[0005]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的基于用户依赖关系的社交网络转发行为预测方法及装置。
[0006]根据本专利技术实施例的一个方面,提供了一种基于用户依赖关系的社交网络转发行为预测方法,其包括:
[0007]根据用户社交关系确定用户群体,得到用户群体中各用户的第一嵌入向量;
[0008]根据转发过程以及用户的第一嵌入向量,计算得到包含上下文依赖向量的用户的第二嵌入向量;根据用户的第二嵌入向量以及预设方向掩码,基于自注意力机制,按照用户转发文本内容的顺序进行跨层连接及归一化处理,得到转发过程的转发用户序列嵌入;
[0009]根据文本内容,确定文本内容的转发文本嵌入向量;
[0010]根据文本内容的转发文本嵌入向量以及转发用户序列嵌入,计算得到转发用户序列嵌入对文本内容的注意力结果,根据注意力结果得到用户转发文本内容的预测概率。
[0011]可选地,根据用户社交关系确定用户群体,得到用户群体中各用户的第一嵌入向量进一步包括:
[0012]获取用户社交关系,根据用户社交关系,确定用户群体,构建用户社交关系网;用户社交关系网以图数据结构构建,包含多个用户节点,以及与用户节点相连的邻居节点;
[0013]针对用户群体,将各个用户节点的向量输入至图神经网络模型,得到用户群体中各用户的第一嵌入向量。
[0014]可选地,针对用户群体,将各个用户节点的向量输入至图神经网络模型,得到用户
群体中各用户的第一嵌入向量进一步包括:
[0015]针对用户群体中任一用户节点,将用户节点的向量以及用户节点的邻居节点的向量输入至图神经网络模型,计算各邻居节点对用户节点的影响力,并基于多头注意力机制,根据影响力,将得到的用户节点的多个注意力结果进行拼接;输出多个注意力结果的平均值作为用户节点的嵌入向量;
[0016]将预设随机向量与用户节点的嵌入向量拼接,得到用户的第一嵌入向量。
[0017]可选地,根据转发过程以及用户的第一嵌入向量,计算得到包含上下文依赖向量的用户的第二嵌入向量进一步包括:
[0018]根据转发过程的转发顺序计算在先转发用户对在后转发用户的影响力,根据影响力加权计算得到在后转发用户的上下文依赖向量;
[0019]将用户的第一嵌入向量以及用户的上下文依赖向量融合,得到包含上下文依赖向量的用户的第二嵌入向量。
[0020]可选地,根据文本内容,确定文本内容的转发文本嵌入向量进一步包括:
[0021]根据文本内容,确定文本内容的发布时间嵌入向量、文本背景及内容嵌入向量,以及文本年龄嵌入向量;
[0022]将文本内容的发布时间嵌入向量、文本背景及内容嵌入向量,以及文本年龄嵌入向量进行拼接,得到文本内容的转发文本嵌入向量。
[0023]可选地,根据文本内容,确定文本内容的发布时间嵌入向量、文本背景及内容嵌入向量,以及文本年龄嵌入向量进一步包括:
[0024]根据文本内容的发布时间,按照多个预设维度确定文本内容的发布时间的时间特征;多个预设维度包括每日、每周和/或节假日维度;时间特征采用独热编码表示;
[0025]根据多个预设维度的文本内容的发布时间的时间特征,确定多个预设维度的时间嵌入向量;
[0026]将多个预设维度的时间嵌入向量拼接,得到文本内容的发布时间嵌入向量;
[0027]根据文本内容,得到对应的文本内容嵌入向量,以及,根据热点内容构建对应的热点内容嵌入向量;
[0028]基于注意力机制,根据文本内容嵌入向量和热点内容嵌入向量计算热点内容与文本内容的相似度,并根据相似度计算得到文本内容的背景特征向量;
[0029]计算背景特征向量以及文本内容嵌入向量的权重,根据权重,计算得到文本背景及内容嵌入向量;权重基于门控机制得到;
[0030]基于时间注意力机制,确定文本内容的年龄特征,根据年龄特征得到文本年龄嵌入向量。
[0031]可选地,根据文本内容的转发文本嵌入向量以及转发用户序列嵌入,计算得到转发用户序列嵌入对文本内容的注意力结果,根据注意力结果得到用户转发文本内容的预测概率进一步包括:
[0032]根据文本内容的转发文本嵌入向量计算对转发用户序列嵌入的各用户的影响力,并根据影响力及转发用户序列嵌入,得到转发用户序列嵌入对文本内容的注意力结果;
[0033]根据注意力结果,得到转发顺序中用户向下一用户转发文本内容的预测概率。
[0034]可选地,根据注意力结果,得到转发顺序中用户向下一用户转发文本内容的预测
概率进一步包括:
[0035]基于多层感知机计算注意力结果,得到转发顺序中用户向下一用户转发文本内容的预测概率。
[0036]可选地,方法还包括:
[0037]预测得到用户群体的目标转发概率,并根据目标转发概率和训练集中样本转发概率对预测模型进行优化处理。
[0038]根据本专利技术实施例的另一方面,提供了一种基于用户依赖关系的社交网络转发行为预测装置,装置包括:
[0039]第一用户向量模块,适于根据用户社交关系确定用户群体,得到用户群体中各用户的第一嵌入向量;
[0040]第二用户向量模块,适于根据转发过程以及用户的第一嵌入向量,计算得到包含上下文依赖向量的用户的第二嵌入向量;根据用户的第二嵌入向量以及预设方向掩码,基于自注意力机制,按照用户转发文本内容的顺序进行跨层连接及归一化处理,得到转发过程的转发用户序列嵌入;
[0041]文本向量模块,适于根据文本内容,确定文本内容的转发文本嵌入向量;
[0042]预测模块,适于根据文本内容的转发文本嵌入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户依赖关系的社交网络转发行为预测方法,其特征在于,方法包括:根据用户社交关系确定用户群体,得到所述用户群体中各用户的第一嵌入向量;根据转发过程以及用户的所述第一嵌入向量,计算得到包含上下文依赖向量的用户的第二嵌入向量;根据用户的所述第二嵌入向量以及预设方向掩码,基于自注意力机制,按照用户转发文本内容的顺序进行跨层连接及归一化处理,得到转发过程的转发用户序列嵌入;根据文本内容,确定所述文本内容的转发文本嵌入向量;根据所述文本内容的转发文本嵌入向量以及所述转发用户序列嵌入,计算得到所述转发用户序列嵌入对所述文本内容的注意力结果,根据所述注意力结果得到用户转发文本内容的预测概率。2.根据权利要求1所述的方法,其特征在于,所述根据用户社交关系确定用户群体,得到所述用户群体中各用户的第一嵌入向量进一步包括:获取用户社交关系,根据所述用户社交关系,确定用户群体,构建用户社交关系网;所述用户社交关系网以图数据结构构建,包含多个用户节点,以及与用户节点相连的邻居节点;针对所述用户群体,将各个用户节点的向量输入至图神经网络模型,得到用户群体中各用户的第一嵌入向量。3.根据权利要求2所述的方法,其特征在于,所述针对所述用户群体,将各个用户节点的向量输入至图神经网络模型,得到用户群体中各用户的第一嵌入向量进一步包括:针对所述用户群体中任一用户节点,将所述用户节点的向量以及所述用户节点的邻居节点的向量输入至图神经网络模型,计算各邻居节点对所述用户节点的影响力,并基于多头注意力机制,根据所述影响力,将得到的所述用户节点的多个注意力结果进行拼接;输出多个注意力结果的平均值作为所述用户节点的嵌入向量;将预设随机向量与所述用户节点的嵌入向量拼接,得到所述用户的第一嵌入向量。4.根据权利要求1所述的方法,其特征在于,所述根据转发过程以及用户的所述第一嵌入向量,计算得到包含上下文依赖向量的用户的第二嵌入向量进一步包括:根据转发过程的转发顺序计算在先转发用户对在后转发用户的影响力,根据所述影响力加权计算得到在后转发用户的上下文依赖向量;将用户的所述第一嵌入向量以及用户的上下文依赖向量融合,得到包含上下文依赖向量的用户的第二嵌入向量。5.根据权利要求1所述的方法,其特征在于,所述根据文本内容,确定所述文本内容的转发文本嵌入向量进一步包括:根据文本内容,确定所述文本内容的发布时间嵌入向量、文本背景及内容嵌入向量,以及文本年龄嵌入向量;将所述文本内容的发布时间嵌入向量、文本背景及内容嵌入向量,以及文本年龄嵌入向量进行拼接,得到文本内容的转发文本嵌入向量。6.根据权利要求5所述的方法,其特征在于,所述根据文本内容,确定所述文本内容的发布时间嵌入向量、文本背景及内容嵌入向量,以及文本年龄嵌入向量进一步包括:根据文本内容的发布时间,按照多个预设维度确定所述文本内容的发布时间的时间特
征;所述多个预设维度包括每日、每周和/或节假日维度;所述时间特征采用独热编码表示;根据所述多个预设维度的所述文本内容的发布时间的时间特征,确定多个预设维度的时间嵌入向量;将所述多个预设维度的时间嵌入...

【专利技术属性】
技术研发人员:仝春艳张凯杨松张铮
申请(专利权)人:人民网股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1