【技术实现步骤摘要】
一种基于图结构对抗学习的社交媒体谣言检测方法及装置
本专利技术涉及通信
,特别是涉及一种基于图结构对抗学习的社交媒体谣言检测方法及装置。
技术介绍
社交媒体上谣言的广泛传播,对政治、经济、日常生活等方方面面产生了巨大影响,所以社交媒体上的谣言检测受到工业界和学术界的极大关注。谣言检测的方法一般有基于特征工程的检测方法,由于基于特征工程的方法需要人工设计很多特征,这使得检测流程很复杂,并且检测效果欠佳。
技术实现思路
本专利技术实施例的目的在于提供一种基于图结构对抗学习的社交媒体谣言检测方法及装置,用以解决现有技术中基于特征工程的方法需要人工设计很多特征,使得检测流程很复杂,并且检测效果欠佳的技术问题。具体技术方案如下:第一方面,本专利技术实施例提供了一种基于图结构对抗学习的社交媒体谣言检测方法,包括:获取社交媒体中待检测消息的内容信息及社交网络结构;将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标 ...
【技术保护点】
1.一种基于图结构对抗学习的社交媒体谣言检测方法,其特征在于,包括:/n获取社交媒体中待检测消息的内容信息及社交网络结构;/n将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。/n
【技术特征摘要】
1.一种基于图结构对抗学习的社交媒体谣言检测方法,其特征在于,包括:
获取社交媒体中待检测消息的内容信息及社交网络结构;
将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。
2.如权利要求1所述的方法,其特征在于,所述节点包括:消息节点以及与所述消息节点相关联的相关节点,所述相关节点包括:用户节点及评论节点,通过如下步骤,训练得到所述检测器:
各样本带有标签,所述标签用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签;
每次对一个样本执行如下步骤:
步骤建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征;
步骤对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征;
步骤将伪装后社交网络结构的特征及原始内容信息的特征连接,作为所述原始消息的最终特征;
步骤基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
对所述样本集中的各样本,通过所述步骤至所述步骤得到所有原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
确定所有原始消息的鉴别结果的准确率,返回步骤继续执行,直至本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值不大于预设阈值,以训练得到所述检测器,其中,所述所有原始消息的鉴别结果的准确率是指所有原始消息的鉴别结果相较于所述样本集中所有原始消息的标签的准确率。
3.如权利要求2所述的方法,其特征在于,所述建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征,包括:
获取伪装类型矩阵;
根据所述伪装类型矩阵,确定在所述原始社交网络结构中的两个节点能否进行伪装的行动遮罩矩阵;
根据所述伪装类型矩阵以及所述行动遮罩矩阵,改变所述原始社交网络结构中的边,得到改变后社交网络结构;
根据所述伪装类型矩阵,确定所述改变后社交网络结构中的两个节点能否执行伪装的行为矩阵;
在所述改变后社交网络结构的基础上,建立所述行动遮罩及所述行为的对应关系;
在原始社交网络结构及所述对应关系,得到伪装后社交网络结构;
在伪装后社交网络中使用图卷积神经网络提取所述伪装后社交网络结构的特征;
所述对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征,包括:
采用多头的自注意力机制,利用查询矩阵、键矩阵、值矩阵,确定所述原始消息的词向量;
采用卷积神经网络捕捉,所述原始消息的词向量的语义信息,得到所述原始消息的特征图;
使用预设步长的最大池化,处理所述特征图,得到文本内容特征,作为原始内容信息的特征;
所述基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果,包括:
基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,其中所述分类结果为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率;
将所述分类结果,作为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率的鉴别结果。
4.如权利要求3所述的方法,其特征在于,所述基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,包括:采用总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器;其中,所述总体损失函数包括:基于原始社交网络结构,得到的第一损失项以及基于伪装后社交网络结构,得到的第二损失项;
基于所述原始消息的最终特征,通过所述调整后分类器,对所述原始消息分类,得到所述分类结果。
5.一种基于图结构对抗学习的社交媒体谣言检测装置,其特征在于,包括:
获取模块,用于获取社交...
【专利技术属性】
技术研发人员:张熙,杨小雨,吕悦菲,王春露,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。