【技术实现步骤摘要】
改进的TextCNN与TextRNN谣言识别方法
[0001]本专利技术涉及深度学习和谣言识别领域,特别涉及改进的TextCNN与TextRNN谣言识别方法。
技术介绍
[0002]鉴于网络谣言已经严重影响人们的生活以及社会稳定,政府和社交网络平台越来越关注如何通过相关技术手段,及时、快速、准确地识别谣言。现有的谣言检测主要分为人工谣言识别方法、基于机器学习的谣言识别方法和基于深度学习的谣言识别方法。人工谣言识别,是当前社交网络平台上主流的谣言检测方式,平台将用户发布的可疑言论交给专业人士,利用他们的知识和经验来判定这些言论是否真实。基于机器学习的谣言识别,将谣言识别抽象成一个分类问题,主要从消息数据中提取有效的特征,并用分类模型对这些特征进行训练学习,得到谣言分类模型。这些传统机器学习方法非常依赖特征工程,需要耗费大量人力物力和时间来构建合适的特征向量,所以目前研究者们尝试把特征学习能力很强的深度学习应用在谣言识别上。Kwon提出了一个新的周期性时间序列模型来表明谣言可能会随时间波动。Ma提出的模型基于递归神经网络(RNN ...
【技术保护点】
【技术特征摘要】
1.改进的TextCNN与TextRNN谣言识别方法,其特征在于,包括如下步骤:步骤1,通过BERT预训练模型将言论文本及其评论转化为句向量;使用经过预先训练的BERT
‑
WWM模型,将网络社交平台的言论文本及其评论作为输入,所述BERT
‑
WWM模型中包含12层的Transformer,取倒数第二层作为所述言论文本及其评论的句向量输出;言论文本及其评论经过Bert预训练模型得到的句向量矩阵有N行、V列,N为输入Bert预训练模型中的言论文本及其评论的句子的个数,V列对应Bert预训练模型输出的句向量维度;步骤2,构建改进的TextCNN模型;步骤1中的句向量做为TextCNN模型的输入,采用3个不同大小的卷积核对句向量进行卷积,分别为(F
i
,V,1,Channel)(i=1,2,3),其中F
i
表示卷积核的行数、V表示卷积核的列数,与句向量矩阵的列数相同,“1”表示输入向量的通道数,Channel表示卷积核通道个数;句向量与卷积核采用Valid模式卷积,卷积后的尺寸为(N
‑
F
i
+1,1,Channel)(i=1,2,3);再分别经过不同的池化层(1,N
‑
F
i
+1,1,1)(i=1,2,3)进行特征过滤,再拼接成长度为3*Channel的特征向量,最后通过一个全连接层转化为二分类问题;由归一化指数函数Softmax函数计算言论为谣言的概率,记为p
m
‑
CNN
(rumor),由归一化指数函数Softmax函数计算言论为非谣言的概率,记为p
m
‑
CNN
(norumor);步骤3,构建改进的TextRNN模...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。