本发明专利技术的目的是提供一种用于检测互动平台中爆发信息的方法与设备,其中,检测设备通过获取互动平台中多个发布信息以确定爆发模式,进而根据所述爆发模式,从所述多个发布信息中确定爆发信息。与现有技术相比,本发明专利技术可以及时准确地检测互动平台中是否产生爆发现象,使得对爆发信息进行有效处理成为可能,从而达到用户能够有效获取互动平台的信息和进行互动沟通的目的。
【技术实现步骤摘要】
本专利技术涉及网络
,尤其涉及一种用于检测互动平台中爆发信息的技术。
技术介绍
随着网络技术的不断发展,越来越多的用户通过网络互动平台进行信息的交流,进而达到了消息快速传播的目的,但是也随之出现一种在网络互动平台中爆发信息的现象。该信息爆发的现象通过在短时间之内有组织地、不断重复地发送相同或相似无意义内容,使其他正常用户无法进行正常发言,且正常发言会很快被大量无意义爆发信息所淹没。该信息爆发现象严重影响了互动平台中的正常秩序,阻碍了信息的正常发布和接收以及网络用户间的正常交流。因此,如何有效地检测互动平台中爆发信息,成为目前亟待解决的问题之一。
技术实现思路
本专利技术的目的是提供一种检测互动平台中爆发信息的方法与设备。根据本专利技术的一个方面,提供了一种计算机实现的用于检测互动平台中爆发信息的方法,其中,该方法包括以下步骤a获取互动平台中多个发布信息;b根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;c通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;d根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。根据本专利技术的另一方面,还提供了一种用于检测互动平台中爆发信息的设备,其中,该设备包括信息获取装置,用于获取互动平台中多个发布信息;群发模式获取装置,用于根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;爆发模式获取装置,用于通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;确定装置,用于根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。与现有技术相比,本专利技术通过判断互动平台中多个发布信息的爆发模式,进而确定与该爆发模式相对应的爆发信息,由此可以及时准确地检测互动平台中是否产生爆发现象,使得对爆发信息进行有效处理成为可能,从而达到用户能够有效获取互动平台的信息和进行互动沟通的目的。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显图I示出根据本专利技术一个方面用于检测互动平台中爆发信息的设备示意图;图2示出根据本专利技术一个方面用于检测互动平台中爆发信息的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施例方式下面结合附图对本专利技术作进一步详细描述。图I示出根据本专利技术一个方面用于检测互动平台中爆发信息的设备示意图。检测设备I包括信息获取装置11、群发模式获取装置12、爆发模式获取装置13和确定装置14。在此,检测设备I包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。具体地,信息获取装置11获取互动平台中多个发布信息。更具体地,信息获取装置11在预定的时间间隔内或连续地获取互动平台或互动平台的特定版块中多个发布信息,例如通过实时监听用户通过用户设备提交的发布信息提交请求,以获取用户输入的发布信息,或者在预定的时间间隔内周期性地通过约定的通信方式,如http、https等通信协议,从互动平台中提取最新的多个发布信息。例如,检测设备I为论坛的网络服务器,用户通过用户设备通过该论坛的网页输入界面输入一段文本信息作为发布信息,然后,用户设备将该发布信息作为该论坛的发帖包装成http请求并通过http通信协议提交到检测设备I的信息获取装置11,接着,信息获取装置11通过实时监听用户消息,接收并解析该http请求,获取其中的发布信息。再如,信息获取装置11每隔五分钟周期地提取互动平台中最新的多个发布信息。在此,所述互动平台包括但不限于社区、论坛、博客、微博,购物网站中对商品的点评、新闻评论、短信互动等。本领域技术人员应能理解上述获取多个发布信息的方式仅为举例,其他现有的或今后可能出现的获取多个发布信息的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并在此以引用方式包含于此。随后,群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式。具体地,群发模式获取装置12根据信息获取装置11获取的多个发布信息,通过例如对该些发布信息相互之间进行分析比对,以判断该些多个发布信息是否具有相同或相似的发布特征,进而获取与该些多个发布信息相对应的一个或多个群发模式。其中,所述群发模式意为由信息发布者发布的具有相同或相似发布特征的多个发布信息的信息发布模式,例如某一论坛中就某一热点话题,多个信息发布者发布具有多个相同关键词的帖子的信息发布模式,或者某一论坛中,由多个信息发布者发布的内容完全相同的帖子的信息发布模式。例如,信息获取装置11在论坛的网球版块中获取100个发布信息,群发模式获取装置12将该100个发布信息相互之间进行分析比对,以获得该100个发布信息中的90个发布信息的标题均具有关键词“李娜”、“夺冠”,则据此可获取与该90个发布信息相对应的一个群发模式。又例如,信息获取装置11在论坛的李宇春版块中获取的100个发布信息,群发模式获取装置12将该100个发布信息相互之间进行分析比对,判断获得其中有80个发布信息的标题中的中文字符均相同,进而可获取与该80个发布信息相对应的一个群发模式。本领域技术人员应能理解上述获取群发模式的方式仅为举例,其他现有的或今后可能出现的获取群发模式的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并在此以引用方式包含于此。接着,爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式。具体地,爆发模式获取装置13将群发模式获取装置12获取的一个或多个群发模式在爆发模式库中进行匹配查询,例如将该一个或多个群发模式与该爆发模式库中的爆发模式进行匹配,或者通过将具有群发模式特征的多个发布信息相互之间进行比较分析,以提取其发布特征,进而将该些发布特征在爆发模式库中与多个爆发模式进行匹配,并据此匹配获得与该(些)群发模式相对应的一个或多个爆发模式。其中,所述爆发模式包括但不限于多个发布信息的标题内容的字符数值相同,多个发布信息内容在只保留中文字符时的中文字符数相同,信息发布者账号内容在只保留中文字符时相同,多个发布信息的标题内容为诗句,多个发布信息的内容为歌词等。在此,所述爆发模式库用于存储爆发模式。例如,群发模式获取装置12获取与网球版块中关键词均为“李娜” “夺冠”的90个发布信息相对应的一个群发模式;接着,爆发模式获取装置13将该些发布信息相互之间进行比较分析,以提取其全部发布特征为该些发布信息的标题中均含有关键词“李娜” “夺冠”,且该90个发布信息中的80个发布信息为含有“RE”的回复信息,进而将该些发布特征在爆发模式库中进行匹配查询,未匹配获得与该发布特征相对应的爆发模式。又例如,群发模式获取装置12获取80个发布信息相对应的一个群发模式,该群发模式为发布信息标题的中文字数均相同;接着,爆发模式获取装置13将该些发布信息相互之间进行比较分析,获取发布信息的标题中文字符均为“床前明月光,疑是地上霜”,进而在爆发模式库本文档来自技高网...

【技术保护点】
一种计算机实现的用于检测互动平台中爆发信息的方法,该方法包括以下步骤:a获取互动平台中多个发布信息;b根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;c通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;d根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。
【技术特征摘要】
【专利技术属性】
技术研发人员:李彦宏,舒迅,帅帅,尹佳,陈楚洁,周天,方勇,王波,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。