System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于内容感知的社交行为预测方法、装置、设备及介质制造方法及图纸_技高网

基于内容感知的社交行为预测方法、装置、设备及介质制造方法及图纸

技术编号:40784357 阅读:5 留言:0更新日期:2024-03-28 19:16
本发明专利技术涉及一种基于内容感知的社交行为预测方法、装置、设备及介质,方法包括:获取社交网络图,所述社交网络图包含节点的历史发文;对所述社交网络图进行编码以获得嵌入矩阵;基于所述社交网络图获取社交三元组样本;将所述源节点发文进行编码以获得文本特征嵌入,将所述源节点特征嵌入、文本特征嵌入和目标节点特征嵌入拼接以获得输入向量;将所述输入向量输入预测模型对目标节点针对源节点发文的行为进行概率预测,基于概率预测结果和所述行为标签确定预测损失值;基于所述损失值对所述预测模型进行训练,训练得到的预测模型用于对目标节点针对源节点发文的行为预测。

【技术实现步骤摘要】

本专利技术属于社交网络,具体而言涉及一种基于内容感知的社交行为预测方法、装置、设备及介质


技术介绍

1、近年来,社交媒体已成为最普遍的应用之一。人们习惯并愿意在社交媒体上分享我们周围发生的有趣内容。其他用户可以根据自己的喜好对内容采取行动(例如,转推点赞等)。积极行动背后的根本原因可归因于几个因素。一个是这些用户之间的关系,尤其是源用户和目标用户之间的本地网络。另一个是内容在多大程度上吸引用户与其关注者分享。据本工作所了解,现有的工作并没有系统地分析所有因素。

2、社会影响是社会科学的一个关键概念,它描述了个人的行为在社会环境(包括真实和虚拟空间)中受到他人影响的广泛现象。1958年,kelman将社会影响确定为三个品种:顺从,识别和内化。此后,人们在表征、分析和预测社会影响方面做出了许多努力。

3、社会影响预测已成为社交网络分析领域最重要的问题之一,它可以帮助我们发现社会影响力背后的基本原理。然而,对社会影响力的预测是困难的,因为预测背后有很多因素。一个重要因素是社交网络的作用,这体现在社交网络的图结构上。因此,捕捉社交网络的结构是预测社会影响力的关键。社交媒体中社会影响力预测的另一个因素是内容,高质量的内容更有可能在在线社交媒体中被注意到,因此我们需要考虑内容文本进行预测。

4、目前已有一些研究探索对不同因素对社交影响力的预测,首先是纯粹地基于文本特征的方法,基于文本的方法利用各种与文本相关的统计特征来有效地模拟社会影响。例如,有一种转发模式,即冷漠中立和积极的推文比混合中立和消极的推文传播得更广。其次,bpf++(贝叶斯泊松分解++)利用各种社会影响和推文相似性,以增强性能,它进一步将用户之间的信任级别合并到其框架。然而,这些方法面临着准确性和计算资源之间的权衡,这将损害其在大数据分析和实时数据流处理的背景下扩大规模时的有效性。

5、其次是基于图神经网络的方法,由于社会影响中的用户级机制,每个用户只受他/她的近邻影响,基于图的方法是另一个研究主线。topical affinity propagation(tap)旨在模拟对学术网络和异构网络中不同主题的影响。后来由于深度学习的出现,引入了深度学习可以极大地提高预测的性能。deepinf提出了一个端到端的框架,通过学习用户的潜在特征来预测社会影响力,该框架使用gat(图注意力网络)对待预测用户的周围节点进行建模的问题,即建模目标用户周围用户的特征以及是否采取预期行动来预测中心用户进行相应行为的概率。作为deepinf的改进,diffusegnn进一步提出了一种分层图神经网络方法来捕获基于结构的社交特征。但是,这些方法会忽略预测的丰富文本信息。例如,预测用户r是否转发用户u的帖子,不仅受用户r和u的本地网络结构的影响,还受帖子文本信息的影响。

6、从技术的方面来讲,如何获得每个用户节点的特征成为一个关键问题。目前已有的方法分为两种,首先是直接将图进行嵌入表示:deepwalk率先将图的路径视为句子,并采用skip-gram技术来推导出潜在节点表示。line定义损失函数以分别保持一阶或二阶邻近性。node2vec创新性地定义了节点网络邻域的通用概念,并设计了一个有偏差的随机游走过程,可以有效地探索各种邻域变化。其次是基于图神经网络的方法:近年来,由于gnn(图神经网络)的普及和进步,gnn(图神经网络)代表了为图形结构化数据量身定制的深度学习技术的延伸。该类方法通过将节点本身的特征与周围节点进行消息传递(messagepassing)进而每个节点便拥有了其他邻居节点的属性。该类典型方法包括gcn、gat、gin等变体,并且这些gnn(图神经网络)结构也成为上述介绍的deepinf和diffusegnn的主干网络。

7、现有的大多数工作都聚焦于用户本身的特征(性别、年龄、地理位置等)或者用户所处的社交网络中的其他用户对本用户行为的影响,并没有注意到内容本身对用户行为的影响,而这一方面往往极为重要。

8、综上,现有技术中对于社会影响力的预测存在未考虑用户行为的内容文本对于预测的影响导致结果评价较低的问题。


技术实现思路

1、鉴于上述的分析,本专利技术实施例旨在提供一种基于内容感知的社交行为预测方法、装置、设备及介质,用以解决现有技术中对于社会影响力的预测存在未考虑用户行为的内容文本对于预测的影响导致结果评价较低的问题。

2、本专利技术提供一种基于内容感知的社交行为预测方法,包括以下步骤:

3、获取社交网络图,所述社交网络图包含节点的历史发文;

4、对所述社交网络图进行编码以获得嵌入矩阵,所述嵌入矩阵包括对应于节点的特征嵌入,所述嵌入矩阵基于所述历史发文特征和节点的网络拓扑特征融合生成;

5、基于所述社交网络图获取社交三元组样本,所述社交三元组样本包括源节点、源节点发文以及目标节点,所述社交三元组样本还包括行为标签;

6、基于所述嵌入矩阵获取所述源节点对应的源节点特征嵌入,所述目标节点对应的目标节点特征嵌入,将所述源节点发文进行编码以获得文本特征嵌入,将所述源节点特征嵌入、文本特征嵌入和目标节点特征嵌入拼接以获得输入向量;

7、将所述输入向量输入预测模型对目标节点针对源节点发文的行为进行概率预测,基于概率预测结果和所述行为标签确定预测损失值;

8、基于所述损失值对所述预测模型进行训练,训练得到的预测模型用于对目标节点针对源节点发文的行为预测。

9、在一些实施例中,对所述社交网络图进行编码以获得嵌入矩阵,包括:

10、获取第一图,所述第一图包含源节点和目标节点,所述第一图的节点具有历史发文;

11、对所述历史发文进行编码以获得所述第一图的特征矩阵,所述特征矩阵包含对应于节点的文本特征;

12、根据所述第一图的邻接矩阵和所述特征矩阵对所述图进行边和节点文本特征的随机掩码,以至少获得第二图和第三图;

13、通过编码器分别根据所述第二图的邻接矩阵和特征矩阵进行编码以获得第一嵌入矩阵,通过所述编码器分别根据所述第三图的邻接矩阵和特征矩阵进行编码以获得第二嵌入矩阵;

14、根据所述第一嵌入矩阵和所述第二嵌入矩阵构建节点特征重建损失和边重建损失,根据所述节点特征重建损失和边重建损失确定损失值;

15、依据所述损失值对所述编码器进行训练,通过训练获得的编码器对图编码以获得嵌入矩阵。

16、在一些实施例中,将所述源节点发文进行编码以获得文本特征嵌入,包括:

17、通过多语言e5-large模型将源节点发文编码以获得所述文本特征嵌入。

18、在一些实施例中,所述预测模型的深度神经网络包括多层感知机。

19、在一些实施例中,将所述输入向量输入预测模型之前还包括:

20、对所述输入向量进行预处理,预处理包括批量归一化和随机丢弃。

21、在一些实施例中,所述社交三元组样本基于所述行为本文档来自技高网...

【技术保护点】

1.一种基于内容感知的社交行为预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:对所述社交网络图进行编码以获得嵌入矩阵,包括:

3.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:将所述源节点发文进行编码以获得文本特征嵌入,包括:

4.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:所述预测模型的深度神经网络包括多层感知机。

5.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:将所述输入向量输入预测模型之前还包括:

6.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:所述社交三元组样本基于所述行为标签分为正样本和负样本;

7.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:所述预测损失值的计算方法表示为:

8.一种基于内容感知的社交行为预测装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7任一项所述的基于内容感知的社交行为预测方法。

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的基于内容感知的社交行为预测方法。

...

【技术特征摘要】

1.一种基于内容感知的社交行为预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:对所述社交网络图进行编码以获得嵌入矩阵,包括:

3.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:将所述源节点发文进行编码以获得文本特征嵌入,包括:

4.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:所述预测模型的深度神经网络包括多层感知机。

5.根据权利要求1所述的基于内容感知的社交行为预测方法,其特征在于:将所述输入向量输入预测模型之前还包括:

6.根据权利要求1所述的基于内容感知的社交...

【专利技术属性】
技术研发人员:王博杰岑宇阔
申请(专利权)人:北京智谱华章科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1