【技术实现步骤摘要】
谣言检测方法、装置、设备及存储介质
[0001]本申请涉及文本处理
,具体涉及一种谣言检测方法、装置、设备及存储介质。
技术介绍
[0002]在互联网时代,社交媒体平台由于其言论自由、信息共享等特性受到人们的喜爱,但由于其信息量庞大、传播速度快等特点,使得社交媒体平台中存在大量的谣言或虚假信息。任由谣言肆意传播可能会严重扰乱人们的正常生活,影响社会的安定,从而对社会产生不可估量的危害。而大多数人由于专业知识、时间和空间的限制,无法精准识破谣言,因此,快速且有效地识别谣言,对净化网络环境、维护社会的稳定具有重要意义。
[0003]目前,主要以提取文本特征的方法对进行谣言检测,虽然能够自动学习文本特征,但由于文本特征单一,因此,对谣言的识别精度不高。或者,在提取文本特征的基础上引入一些其它特征来辅助谣言检测,虽能够提升谣言检测性能,但过度聚焦于提取文本以外的特征,从而忽略了文本信息的固有特征,导致辅助特征过度流入造成过拟合问题,从而影响对谣言的检测精度。
技术实现思路
[0004]本申请实施例提供一 ...
【技术保护点】
【技术特征摘要】
1.一种谣言检测方法,其特征在于,所述谣言检测方法包括以下步骤:获取待检测的文本信息,提取所述文本信息的文本特征和词频统计特征;根据所述文本特征确定所述文本信息的可信度,并根据所述可信度确定所述文本特征和所述词频统计特征的融合度;基于所述融合度融合所述文本特征和所述词频统计特征,得到融合特征;根据所述融合特征检测所述文本信息中是否包含谣言信息。2.根据权利要求1所述的谣言检测方法,其特征在于,所述基于所述融合度融合所述文本特征和所述词频统计特征,得到融合特征的步骤,包括:将所述文本特征投影到预设的信息空间中,得到文本投影特征;将所述词频统计特征投影到所述信息空间中,得到统计投影特征;根据所述融合度确定所述统计投影特征的融合权重值,基于所述融合权重值,将所述统计投影特征与所述文本投影特征融合,得到融合特征。3.根据权利要求2所述的谣言检测方法,其特征在于,所述根据所述文本特征确定所述文本信息的可信度的步骤,包括:确定所述文本特征的特征信息,获取所述文本特征对应的参数矩阵;基于所述参数矩阵和所述特征信息,利用预设的激活函数对所述文本投影特征进行激活,得到所述文本特征对应的可信度变量值,其中,所述特征信息包括维度信息、内容信息和长度信息;通过所述可信度变量值评估所述文本信息的可信度。4.根据权利要求2所述的谣言检测方法,其特征在于,所述根据所述融合特征检测所述文本信息中是否包含谣言信息的步骤,包括:基于预设的注意力机制,对所述融合特征和所述文本特征进行注意力融合,得到目标特征;将所述目标特征投影到预设的标签空间中,以对所述文本信息进行谣言分类;根据对所述文本信息的谣言分类结果,确定所述文本信息中是否包含谣言信息。5.根据权利要求1所述的谣言检测方法,其特征在于,所述提取所述文本信息的文本特征和词频统计特征的步骤,包括:获取所述文本信息中各个单词的词频统计向量;对各所述词频统计向量进行编码处理,得到所述文本信息的词频统计特征,所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。