谣言检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39006329 阅读:23 留言:0更新日期:2023-10-07 10:37
本发明专利技术涉及数据处理领域,揭露一种谣言检测方法,包括:利用第一模块对待识别事件的第一个子数据进行向量提取,得到文本向量,及对时间戳进行向量提取,得到时间向量;将文本向量与时间向量进行拼接,得到第一个子数据的时间文本向量序列,将时间文本向量序列输入长短期记忆层进行处理,得到第一状态序列向量;利用第二模块计算第一状态序列向量的第一隐向量,得到第一个子数据的分类值;若判断分类值为第一预设数值,则将第一状态序列向量输入第三模块中进行分类,得到分类结果。本发明专利技术还提供一种谣言检测装置、电子设备及存储介质。本发明专利技术在金融科技领域中,能够对早期传播阶段的传播事件进行有效识别。传播事件进行有效识别。传播事件进行有效识别。

【技术实现步骤摘要】
谣言检测方法、装置、电子设备及存储介质


[0001]本专利技术涉及数据处理领域,尤其涉及一种谣言检测方法、装置、电子设备及存储介质。

技术介绍

[0002]在信息高速传播的今天,谣言的传播可能误导公众,破坏正常的社会秩序。若能早期对传播事件进行准确检测,是有效阻止谣言传播的重要手段,也是辅助金融或科技领域的执行交易决策的重要依据。
[0003]大部分的谣言检测方法基于特征表示学习的检测方法,该类方法局限于对传播事件中用户行为(例如,有关用户属性或传播事件的转发人数)进行统计和计算,并以此作为用户表示。以此对传播事件中的文本内容和用户特征进行建模,利用建模得到的检测模型对传播事件进行判断,对传播事件中后期传播阶段能够有效识别。
[0004]但该方法在传播事件的早期传播阶段的数据量较少的情况下,无法准确对传播事件进行有效识别。

技术实现思路

[0005]鉴于以上内容,有必要提供一种谣言检测方法,其目的在于解决现有技术中检测模型无法准确对早期传播阶段的传播事件进行有效识别的技术问题。
[0006]本专利技术提供本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种谣言检测方法,其特征在于,所述方法包括:将待识别事件的数据集包含的各个子数据按时间序列进行排序,利用检测模型的第一模块,对排序中第一个子数据的文本信息进行向量提取得到文本向量,及对所述文本信息对应的时间戳进行向量提取得到时间向量;将所述文本向量与所述时间向量进行拼接,得到所述第一个子数据的时间文本向量序列,将所述时间文本向量序列输入所述第一模块的长短期记忆层进行处理,得到第一状态序列向量;利用所述检测模型的第二模块计算所述第一状态序列向量的第一隐向量,得到所述第一个子数据的分类值;分类值若判断所述分类值为第一预设数值,则将所述第一状态序列向量输入所述检测模型的第三模块中进行分类,得到分类结果。2.如权利要求1所述的谣言检测方法,其特征在于,在所述将待识别事件的数据集包含的各个子数据按时间序列进行排序之前,该方法还包括:在一个预设时间段内,获取待识别事件的各条文本信息、各条所述文本信息对应的时间戳作为一个子数据,根据所有预设时间段的子数据生成所述待识别事件的数据集。3.如权利要求1所述的谣言检测方法,其特征在于,所述对排序中第一个子数据的文本信息进行向量提取得到文本向量,包括:利用所述第一模块的向量映射层对所述第一个子数据的文本信息进行向量处理,得到特征向量;利用所述第一模块的池化层对所述特征向量进行池化处理,得到所述文本向量。4.如权利要求1所述的谣言检测方法,其特征在于,所述对所述文本信息对应的时间戳进行向量提取得到时间向量,包括:利用所述第一模块的向量映射层对所述第一文本的时间戳进行向量处理,得到所述时间向量。5.如权利要求1所述的谣言检测方法,其特征在于,所述将所述时间文本向量序列输入所述第一模块的长短期记忆层进行处理,得到第一状态序列向量,包括:将所述时间文本向量序列输入所述长短期记忆层中,获取多个时间戳对应的隐向量;基于各个所述隐向量进行注意力机制计算,得到所述第一状态序列向量。6.如权利要求1所述的谣言检测方法,其...

【专利技术属性】
技术研发人员:刘羲舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1