【技术实现步骤摘要】
构建谣言数据库的方法、分析谣言数据的方法及电子设备
本公开涉及互联网领域,特别涉及一种构建谣言数据库的方法、分析谣言数据的方法及电子设备。
技术介绍
随着互联网的兴起、移动电子设备的普及,信息传播的速度也变得越来越快。一方面为人们的生活带来便利,另一方面也会造成不良影响。如果传播的文章是谣言,则该谣言就会迅速传播,这些谣言严重影响了用户辨别是非的能力,有的谣言还可能会影响用户的正常生活,甚至导致不必要的危害。然而,现有技术中,谣言鉴定主要是专家鉴定,鉴定确定为谣言后再进行文章的删除,但限于审核人力成本,只能对热文做排查,处理效率比较低下。由于现有的审核制度导致谣言文章到处散播,缺乏一种谣言的汇总方式,导致普通用户在阅读文章时无处可以鉴定其阅读的文章是否是谣言。
技术实现思路
有鉴于此,本公开实施例提出了一种构建谣言数据库的方法、分析谣言数据的方法及电子设备,用以解决现有技术的如下问题:由于现有的审核制度导致谣言文章到处散播,缺乏一种谣言的汇总方式,导致普通用户在阅读文章时无处可以鉴定其阅读的文章是否是谣言。一方面,本公开实施例提出了一种构建谣言数据库的方法,包括:获取 ...
【技术保护点】
1.一种构建谣言数据库的方法,其特征在于,包括:获取文章的属性标记为谣言属性的文章;根据所述文章的谣言关键词确定所述文章的领域类别;对所述文章中包含谣言内容的部分进行谣言标识,其中,所述谣言标识至少包括以下之一:标题中包含谣言、文章中部分段落包含谣言、文章所有内容均为谣言;将进行谣言标识后的所述文章按照领域类别保存至谣言数据平台的谣言数据库中。
【技术特征摘要】
1.一种构建谣言数据库的方法,其特征在于,包括:获取文章的属性标记为谣言属性的文章;根据所述文章的谣言关键词确定所述文章的领域类别;对所述文章中包含谣言内容的部分进行谣言标识,其中,所述谣言标识至少包括以下之一:标题中包含谣言、文章中部分段落包含谣言、文章所有内容均为谣言;将进行谣言标识后的所述文章按照领域类别保存至谣言数据平台的谣言数据库中。2.如权利要求1所述的方法,其特征在于,根据所述文章的谣言关键词确定所述文章的领域类别,包括:按照所述文章的谣言关键词进行聚类处理或者分类处理,以确定所述文章的领域类别。3.一种分析谣言数据的方法,应用通过权利要求1或2所述方法构建的谣言数据库,其特征在于,包括:接收对疑似谣言文章进行检索的请求;根据所述请求对所述疑似谣言文章进行谣言关键词提取;根据所述谣言关键词确定所述文章的领域类别;在谣言数据库的所述领域类别对应的谣言文章中检索与所述谣言关键词匹配概率达到预设概率的文章,并将所述达到预设概率的文章及其对应的谣言标识进行显示。4.如权利要求3所述的方法,其特征在于,在所述谣言关键词为多个的情况下,在所述谣言数据库中检索与所述谣言关键词匹配概率达到预设概率的文章,并将所述达到预设概率的文章及其对应的谣言标识进行显示,包括:在所述谣言数据库的所述领域类别对应的谣言文章中检索与第一谣言关键词匹配概率达到第一预设概率的文章;在所述达到第一预设概率的文章中检索与第二谣言关键词匹配概率达到第二预设概率的文章;将所述达到第二预设概率的文章及其对应的谣言标识进行显示。5.如权利要求3所述的方法,其特征在于,将所述达到预设概率的文章及其对应的谣言标识进行显示,包括:按照所述谣言关键词匹配概率由大到小的顺序依次显示谣言文章及其对应的谣言标识。6.如权利要求3至5中任一项所述的方法,其特征在于,根据所述谣言关键词在所述谣言数据库的所述领域类别对应的谣言文章中检索与所述谣言关键词匹配概率达到预设概率的文章之后,还包括:检测所述达到预设概率的文章的数量是否达到预设数量;在所述达到预设概率的文章的数量达到所述预设数量的情况下,确定所述疑似谣言文章为谣言文章,并将所述谣言文...
【专利技术属性】
技术研发人员:宝腾飞,刘真,崔蕊,肖与,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。