一种检测网络中内容的方法和系统技术方案

技术编号:10862836 阅读:95 留言:0更新日期:2015-01-01 22:04
本发明专利技术公开一种检测网络中内容的方法和系统,方法包括接收应用平台发送的网络中发布的内容,以及所述内容对应的指示是否进行重新检测的指示标识;判断接收的所述指示标识是否指示对所述内容进行重新检测;在所述指示标识没有指示对所述内容进行重新检测时,根据检测结果列表对所述内容进行检测,返回检测结果;在所述指示标识指示对所述内容进行重新检测时,接收审核指令,根据所述审核指令对所述内容进行检测,返回检测结果。本发明专利技术解决了将危险内容误判为通过的技术问题,取得了节约人力成本,避免危险内容危害网络的技术效果。

【技术实现步骤摘要】
一种检测网络中内容的方法和系统
本专利技术涉及计算机网络领域,特别涉及检测网络中内容的方法和系统。
技术介绍
随着互联网应用的发展,网络中发布的内容越来越多,这些内容中经常包括垃圾信息或者恶意攻击信息等,因此需要对网络中内容进行检测,以保证网络环境的安全和洁净。现有技术中检测网络中内容的技术方案主要包括敏感词检测和人工检测。其中,人工检测的准确性高,能够精确判断内容是否适当。但是,因为网络中内容量的急剧猛增,使得对所有内容都进行人工检测,会增加巨额的人力成本,而且人工检测的效率也相对较低。敏感词检测为将网络中内容与敏感词库中敏感词进行匹配,如果匹配成功,则该内容命中了敏感词库中的敏感词,由此判断出该内容存在风险,之后对该内容进行人工检测。如果内容没有命中敏感词库中的敏感词,则认为该内容安全,通过检测。在该技术方案中,敏感词库中敏感词的维护经常滞后于网络中内容的发展,经常是内容中某个敏感词出现一段时间后才会被发现。因此,导致部分危险内容不应被检测通过却被误判为通过,因此对网络环境造成了危害,使得内容检测率降低。在现实统计结果中也表明未命中敏感词的内容同样存在大量垃圾信息,特别是各种广告信息。
技术实现思路
本专利技术提供了检测网络中内容的方法和系统,以解决将危险内容误判为通过,内容检测率降低的技术问题。本专利技术公开了一种检测网络中内容的方法,所述方法包括:接收应用平台发送的网络中发布的内容,以及所述内容对应的指示是否进行重新检测的指示标识;其中当所述内容对应的配置参量的值达到预设的参量阀值时,所述指示标识指示对所述内容进行重新检测,所述配置参量用于表征所述内容被关注的程度,所述配置参量的值越大,则所述内容被关注的程度越高;判断接收的所述指示标识是否指示对所述内容进行重新检测;在所述指示标识没有指示对所述内容进行重新检测时,根据检测结果列表对所述内容进行检测,返回检测结果;所述检测结果列表中保存内容的检测结果;在所述指示标识指示对所述内容进行重新检测时,接收审核指令,根据所述审核指令对所述内容进行检测,返回检测结果。其中,所述配置参量至少包括下列参量中的一种:内容被评论的次数;内容被浏览的次数;内容被转发的次数;内容在页面中停留的时长。其中,所述接收应用平台发送的网络中发布的内容后包括:对所述内容进行哈希运算,获得所述内容对应的哈希值;所述检测结果列表中对应地保存内容的哈希值和内容的检测结果;所述根据检测结果列表对所述内容进行检测具体包括:判断所述检测结果列表中是否包括所述哈希值,如果不包括,则根据已接收的与所述内容相同和/或相似内容的数量对所述内容进行检测;如果包括,则获取所述哈希值在所述检测结果列表中对应的检测结果。其中,所述对所述内容进行哈希运算,获得所述内容对应的哈希值具体包括:除去所述内容中冗余信息,对除去冗余信息的所述内容进行哈希运算,获得所述内容对应的指纹哈希值。其中,所述获得所述内容对应的指纹哈希值后还包括:将所述指纹哈希值对应的计数值加1;所述根据已接收的与所述内容相同和/或相似内容的数量对所述内容进行检测具体包括:判断所述指纹哈希值对应的计数值是否大于预设的计数值阀值,如果大于,则接收审核指令,根据所述审核指令对所述内容进行检测;否则,确定检测结果为所述内容通过检测。其中,所述如果大于,则接收审核指令,根据所述审核指令对所述内容进行检测后还包括:在所述检测结果列表中对应地保存所述哈希值和根据所述审核指令对所述内容进行检测所得的检测结果。其中,所述根据已接收的与所述内容相同和/或相似内容的数量对所述内容进行检测之前还包括:判断所述内容是否命中敏感词库中的敏感词;如果是,则接收审核指令,根据所述审核指令对所述内容进行检测,获取检测结果;所述返回检测结果之后还包括:在所述检测结果列表中对应地保存所述内容的哈希值和所得的根据所述审核指令对所述内容进行检测所得的检测结果;如果否,进行所述根据已接收的与所述内容相同和/或相似内容的数量对所述内容进行检测的步骤。其中,所述在所述指示标识指示对所述内容进行重新检测时,接收审核指令,根据所述审核指令对所述内容进行检测,返回检测结果后还包括:在所述检测结果列表中更新所述内容的检测结果为根据所述审核指令对所述内容进行检测所得的检测结果。根据本专利技术的另一方面,公开了一种检测网络中内容的系统,包括:接收单元,用于接收应用平台发送的网络中发布的内容,以及所述内容对应的指示是否进行重新检测的指示标识;其中当所述内容对应的配置参量的值达到预设的参量阀值时,所述指示标识指示对所述内容进行重新检测,所述配置参量用于表征所述内容被关注的程度,所述配置参量的值越大,则所述内容被关注的程度越高;判断单元,用于判断接收的所述指示标识是否指示对所述内容进行重新检测;第一检测单元,用于在所述指示标识没有指示对所述内容进行重新检测时,根据检测结果列表对所述内容进行检测,返回检测结果;所述检测结果列表中保存内容的检测结果;第二检测单元,用于在所述指示标识指示对所述内容进行重新检测时,接收审核指令,根据所述审核指令对所述内容进行检测,返回检测结果。其中,所述系统还包括:哈希值计算单元;所述哈希值计算单元,用于在所述接收单元接收到应用平台发送的网络中发布的内容后,对所述内容进行哈希运算,获得所述内容对应的哈希值;所述检测结果列表中对应地保存内容的哈希值和内容的检测结果;所述根据检测结果列表对所述内容进行检测具体包括:所述第一检测单元,具体用于判断所述检测结果列表中是否包括所述哈希值,如果不包括,则根据已接收的与所述内容相同和/或相似内容的数量对所述内容进行检测;如果包括,则获取所述哈希值在所述检测结果列表中对应的检测结果。本专利技术的有益效果是:通过本专利技术中技术方案,一方面,对于检测结果进行保存,可以应用保存的检测结果对重复内容进行检测,另一方面,由于危险内容的危害性与该内容被关注的程度有关,因此,当内容被关注的程度达到预设阀值后,对该内容进行精确的人工检测。由此,既可以避免对每个内容都进行人工检测,又能够在危险内容造成危害前,纠正对该危险内容的误判,解决了将危险内容误判为通过的技术问题。因为,能够避免对每个内容都进行人工检测,所以取得了节约人力成本、提高检测效率的技术效果,同时因为能够在危险内容造成危害前,纠正对该危险内容的误判,取得了提高检测正确率,避免危险内容危害网络的技术效果。附图说明图1为根据本专利技术一实施例的检测网络中内容的方法的流程图;图2为根据本专利技术一实施例的根据检测结果列表对内容进行检测的流程图;图3为根据本专利技术一实施例的步骤S146中操作的流程图;图4为根据本专利技术另一实施例的检测网络中内容的方法的流程图;图5为根据本专利技术一实施例的检测网络中内容的系统的结构图;图6为根据本专利技术另一实施例的检测网络中内容的系统的结构图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。参见图1,为根据本专利技术一实施例的检测网络中内容的方法的流程图。如图1所示,该方法包括如下流程。步骤S110,接收应用平台发送的网络中发布的内容,以及内容对应的指示是否进行重新检测的指示标识。在内容对应的配置参量的值达到预设的参量阀值时,应用平台发送的指示标识指示对本文档来自技高网...
一种检测网络中内容的方法和系统

【技术保护点】
一种检测网络中内容的方法,其特征在于,所述方法包括:接收应用平台发送的网络中发布的内容,以及所述内容对应的指示是否进行重新检测的指示标识;其中当所述内容对应的配置参量的值达到预设的参量阀值时,所述指示标识指示对所述内容进行重新检测,所述配置参量用于表征所述内容被关注的程度,所述配置参量的值越大,则所述内容被关注的程度越高;判断接收的所述指示标识是否指示对所述内容进行重新检测;在所述指示标识没有指示对所述内容进行重新检测时,根据检测结果列表对所述内容进行检测,返回检测结果;所述检测结果列表中保存内容的检测结果;在所述指示标识指示对所述内容进行重新检测时,接收审核指令,根据所述审核指令对所述内容进行检测,返回检测结果。

【技术特征摘要】
1.一种检测网络中内容的方法,其特征在于,所述方法包括:接收应用平台发送的网络中发布的内容,以及所述内容对应的指示是否进行重新检测的指示标识;其中当所述内容对应的配置参量的值达到预设的参量阀值时,所述指示标识指示对所述内容进行重新检测,所述配置参量用于表征所述内容被关注的程度,所述配置参量的值越大,则所述内容被关注的程度越高;判断接收的所述指示标识是否指示对所述内容进行重新检测;在所述指示标识没有指示对所述内容进行重新检测时,根据检测结果列表对所述内容进行检测,返回检测结果;所述检测结果列表中保存内容的检测结果;在所述指示标识指示对所述内容进行重新检测时,接收审核指令,根据所述审核指令对所述内容进行检测,返回检测结果。2.根据权利要求1所述的方法,其特征在于,所述配置参量至少包括下列参量中的一种:内容被评论的次数;内容被浏览的次数;内容被转发的次数;内容在页面中停留的时长。3.根据权利要求1所述的方法,其特征在于,所述接收应用平台发送的网络中发布的内容后,所述方法还包括:对所述内容进行哈希运算,获得所述内容对应的哈希值;所述检测结果列表中对应地保存内容的哈希值和内容的检测结果;所述根据检测结果列表对所述内容进行检测具体包括:判断所述检测结果列表中是否包括所述哈希值,如果不包括,则根据已接收的与所述内容相同和/或相似内容的数量对所述内容进行检测;如果包括,则获取所述哈希值在所述检测结果列表中对应的检测结果。4.根据权利要求3所述的方法,其特征在于,所述对所述内容进行哈希运算,获得所述内容对应的哈希值具体包括:除去所述内容中冗余信息,对除去冗余信息的所述内容进行哈希运算,获得所述内容对应的指纹哈希值。5.根据权利要求4所述的方法,其特征在于,所述获得所述内容对应的指纹哈希值后还包括:将所述指纹哈希值对应的计数值加1;所述根据已接收的与所述内容相同和/或相似内容的数量对所述内容进行检测具体包括:判断所述指纹哈希值对应的计数值是否大于预设的计数值阀值,如果大于,则接收审核指令,根据所述审核指令对所述内容进行检测;否则,确定检测结果为所述内容通过检测。6.根据权利要求5所述的方法,其特征在于,所述如果大于,则接收审核指令,根据所述审核指令对所述内容进行检测后还包括:在所述检测结果列表中对应地保存所述哈希值和根据...

【专利技术属性】
技术研发人员:田旭东
申请(专利权)人:北京新媒传信科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1