The present disclosure discloses a method, device, storage medium and electronic equipment for deleting rumor articles. The method includes: in the case of receiving a new article published, detecting whether there is an article in the rumor database whose keyword similarity probability is greater than the preset probability; and in the case of an article whose similarity probability is greater than the preset probability, increasing the probability of similarity between a new article and a preset article. As input parameters of presupposed language model, the matching degree between new articles and articles with similar probability greater than presupposed probability is obtained by presupposed language model. When the matching degree is greater than presupposed matching degree, the new articles are deleted from user platform. This publication uses rumor database and presupposed language model to automatically identify new articles published. The double-determination method can identify rumors more objectively and accurately, save the process of human auditing, and can be screened whether it is hot or not. The processing range is wide and the processing efficiency is high.
【技术实现步骤摘要】
删除谣言文章的方法、装置、存储介质及电子设备
本公开涉及互联网领域,特别涉及一种删除谣言文章的方法、装置、存储介质及电子设备。
技术介绍
随着互联网的兴起、移动设备的普及,信息传播的速度也变得越来越快。一方面为人们的生活带来便利,另一方面也会造成不良影响。如果传播的文章是谣言,则该谣言就会迅速传播,这些谣言严重影响了用户辨别是非的能力,有的谣言还可能会影响用户的正常生活,甚至导致不必要的危害。然而,现有技术中,谣言鉴定主要是专家鉴定,鉴定确定为谣言后再进行文章的删除,但限于审核人力成本,只能对热文做排查,处理效率比较低下。
技术实现思路
有鉴于此,本公开实施例提出了一种删除谣言文章的方法、装置、存储介质及电子设备,用以解决现有技术的如下问题:谣言鉴定主要是专家鉴定,鉴定确定为谣言后再进行文章的删除,但限于审核人力成本,只能对热文做排查,处理效率比较低下。一方面,本公开实施例提出了一种删除谣言文章的方法,包括:在接收到发布的新文章的情况下,检测谣言数据库中是否存在与所述新文章的关键词相似概率大于预设概率的文章;在存在相似概率大于预设概率的文章的情况下,将所述新文章与所述相似概率大于预设概率的文章作为预设语言模型的输入参数,通过所述预设语言模型得到所述新文章与所述相似概率大于预设概率的文章的匹配度;在所述匹配度大于预设匹配度的情况下,将所述新文章从用户平台中删除。可选的,所述方法还包括:将所述新文章的属性标记为谣言属性,并将所述新文章添加至所述谣言数据库中。可选的,所述将所述新文章的属性标记为谣言属性包括:识别所述新文章中各部分的内容,将所述新文章的标题和/或段落 ...
【技术保护点】
1.一种删除谣言文章的方法,其特征在于,包括:在接收到发布的新文章的情况下,检测谣言数据库中是否存在与所述新文章的关键词相似概率大于预设概率的文章;在存在相似概率大于预设概率的文章的情况下,将所述新文章与所述相似概率大于预设概率的文章作为预设语言模型的输入参数,通过所述预设语言模型得到所述新文章与所述相似概率大于预设概率的文章的匹配度;在所述匹配度大于预设匹配度的情况下,将所述新文章从用户平台中删除。
【技术特征摘要】
1.一种删除谣言文章的方法,其特征在于,包括:在接收到发布的新文章的情况下,检测谣言数据库中是否存在与所述新文章的关键词相似概率大于预设概率的文章;在存在相似概率大于预设概率的文章的情况下,将所述新文章与所述相似概率大于预设概率的文章作为预设语言模型的输入参数,通过所述预设语言模型得到所述新文章与所述相似概率大于预设概率的文章的匹配度;在所述匹配度大于预设匹配度的情况下,将所述新文章从用户平台中删除。2.如权利要求1所述的方法,其特征在于,所述方法还包括:将所述新文章的属性标记为谣言属性,并将所述新文章添加至所述谣言数据库中。3.如权利要求2所述的方法,其特征在于,所述将所述新文章的属性标记为谣言属性包括:识别所述新文章中各部分的内容,将所述新文章的标题和/或段落标记为谣言属性。4.如权利要求1所述的方法,其特征在于,所述检测谣言数据库中是否存在与所述新文章的关键词相似概率大于预设概率的文章,包括:对所述新文章进行分词处理,以提取所述新文章的关键词;根据所述关键词确定所述新文章的领域类别;在所述谣言数据库的所述领域类别对应的文章中检测是否存在与所述新文章的关键词相似概率大于预设概率的文章。5.如权利要求1至4中任一项所述的方法,其特征在于,所述预设语言模型的训练过程如下:获取谣言数据库中标记为谣言属性的文章和类似谣言文章,将所有获取到的文章作为正样本,其中,所述类似谣言文章为与谣言文章匹配度达到预设匹配度的文章;获取谣言数据库中标记为谣言属性的文章和非谣言文章,将所有获取到的文章作为负样本,其中,所述非谣言文章为与谣言文章匹配度小于预设匹配度的文章;使用所述正样本和所述负样本训练所述预设语言模型学习谣言文章和非谣言文章的匹配关系。6.一种删除谣言文章的装置,其特征在于,包括:检测模块,用于在接收到发布的新文章的情况下,检测谣言数据库中是否存在与所述新文章的关键词相似概率大于预设概率的文章...
【专利技术属性】
技术研发人员:宝腾飞,李建波,刘真,崔蕊,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。