基于动态异质图的社交媒体机器人检测方法及相关装置制造方法及图纸

技术编号:36710812 阅读:65 留言:0更新日期:2023-03-01 09:38
本发明专利技术公开了一种基于动态异质图的社交媒体机器人检测方法及相关装置,1)基于动态异质信息网络的社交媒体建模;2)基于关系图transformer的社交媒体影响力异质性建模;3)基于语义注意力网络跨关系聚合节点;4)基于图神经网络的社交媒体机器人账户检测及多任务聚合。本发明专利技术所公开的基于动态异质图的社交媒体机器人检测方法,提出了首个动态的、异质性感知的社交媒体机器人账户检测模型与算法,并在基准数据集上取得最好效果。本发明专利技术通过建模社交媒体中广泛存在的关系与影响力异质性,增强社交媒体机器人检测算法的鲁棒性,得到了高质量的社交媒体元素表示,可实现多种下游任务,具有信息利用充分、检测有效的特点,具有实际应用的优势。际应用的优势。际应用的优势。

【技术实现步骤摘要】
基于动态异质图的社交媒体机器人检测方法及相关装置


[0001]本专利技术涉及社会网络分析领域,具体涉及基于动态异质图的社交媒体机器人检测方法及相关装置。

技术介绍

[0002]社交媒体正在成为人们日常生活中不可或缺的重要部分,每天都有数以千万记得、来自世界各地的用户登录各式各样的社交媒体平台,浏览新闻网页、分享生活趣事、抑或是参与到社交媒体对某些话题的讨论中去。随着在线社交媒体的流行度提升,一种称为社交媒体机器人账户的新型现象在社交媒体上出现。不同于由真人管理的社交媒体真实用户,社交媒体机器人账户指的是由自动程序或应用程序接口进行操纵的、自动发表社交媒体内容的用户。此类账号的经营者通常通过多个机器人账户以实现恶意目的,而此种行为严重威胁社交媒体的清朗生态。在过去的十年中,社交媒体机器人账户愈发活跃与选举干预、传播假新闻、以及传播极端意识形态中。鉴于恶意社交媒体机器人账户对社会的负面影响,对有效的社交媒体机器人账户检测模型的需求愈发紧迫。
[0003]早期关于社交媒体机器人账户检测的研究工作大多基于特征工程与传统机器学习分类算法,从社交媒本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于动态异质图的社交媒体机器人检测方法,其特征在于,包括:基于异质信息网络建模社交媒体,将社交媒体的用户、推文、话题和社群作为网络节点,将各节点之间不同种类的互动关系作为网络中的异质性边,并利用特征工程与预训练语言模型编码用户信息以及社交媒体文本信息,拼接时间戳信息,得到图神经网络中各节点初始特征;采用关系图transformer建模社交媒体关系和影响力异质性,通过各节点初始特征计算注意力头在不同关系与节点对下的query,key和value数值,并由query和key计算不同节点之间的注意力数值以建模关系的异质性,通过相对时间编码保留动态依赖信息,聚合注意力数值和邻居节点value值得到在特定关系下的节点表示;基于语义注意力网络跨关系聚合节点表示,得到在聚合节点不同关系后的节点表示,以保留社交媒体异质性所带来的关系;经过若干层图神经网络得到最终节点表示,通过输出层和softmax层对用户类型节点进行社交媒体机器人账户预测,同时利用立场检测和社群相似度度量优化检测。2.根据权利要求1所述的基于动态异质图的社交媒体机器人检测方法,其特征在于,基于异质信息网络建模社交媒体过程中,将社交媒体的用户、推文、话题和社群作为网络异质性节点v,将用户、推文、话题和社群之间不同种类的互动关系作为网络中的异质性边e,以集合R
V
,R
E
分别表示异质信息网络中的节点种类和关系种类,用ψ分别表示节点和边的映射至对应类型的映射函数,并用时间函数t对各节点打上时间戳标记,社交媒体动态异质图网络G定义如下:3.根据权利要求2所述的基于动态异质图的社交媒体机器人检测方法,其特征在于,利用特征工程编码节点元数据,并采用预训练语言模型编码用户信息以及社交媒体文本信息语义数据,将得到的编码表征拼接时间戳信息得到各节点特征向量x
i
,利用全连接层神经网络对x
i
进行变换,将得到的结果作为图神经网络中节点的初始特征x
i(0)
,计算公式如下所示:x
i(0)
=σ(W
I
·
x
i
+b
I
)式中,W
I
、b
I
代表模型可学习参数,σ代表非线性激活函数,不同类型的节点表示采用不同的线性映射函数。4.根据权利要求1所述的基于动态异质图的社交媒体机器人检测方法,其特征在于,关系图transformer的社交媒体影响力异质性建模过程中,提出包含transformers并在异质信息网络中运算的图神经网络结构;首先计算第c个注意力头在关系r和节点i下对应的query,key和value的数值,计算公式如下所示:式中,q,k,v为注意力机制中的query,key和value值,(l)表示第l层图神经网络,所有的W和b是模型中对不同关系和注意力头的可学习参数;
随后,通过计算不同节点之间的注意力数值建模关系异质性,其计算方式如下所示:式中,代表节点i与j之间的注意力权重,表示指数型的点积函数,d为每个注意力头的隐藏层维度,N
r
(i)表示节点o在关系r的邻居集合;接着,利用相对时间编码RTE建模节点邻居与节点之间的时间差关系,并将其与节点j的原value值相加以进行时间增广,具体计算公式如下:ΔT(i,j)=|t
i

t
j
||RTE(ΔT(i,j))=W
T
·
Base(ΔT(i,j))+B
T
式中,t
i
表示节点i对应的时间戳,W
T
,B
T
为线性变换参数;接着,利用如下公式,在节点邻居与注意力头中聚合消息以获得在关系r下的节点表示:式中,代表节点i在第l层关系r下的隐藏层表示,C为注意力头总数;然后,对得到的结果使用门机制以平滑表示学习,先计算出门的数值水平再对学到的节点表示和输入使用门操作,具体计算流程如下所示:使用门操作,具体计算流程如下所示:式中,[
·
,
·
]代表向量拼接操作,W
A
、b
A
代表模型可学习参数,

【专利技术属性】
技术研发人员:杨松万和润闫洲郑荔静冯尚彬马梓涵白宇欣赵书庆郑庆华罗敏楠
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1