热门微博的识别方法及装置制造方法及图纸

技术编号:14470026 阅读:64 留言:0更新日期:2017-01-21 02:01
本发明专利技术公开了一种热门微博的识别方法及装置,涉及信息技术领域,能够准确识别每个时刻出现的热门微博,从而能够提升热门微博的识别准确性。所述方法包括:获取当前微博对应的原创微博的标识信息;对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新,所述预置存储位置保存有不同原创微博的标识信息分别对应的出现次数;若更新后的所述出现次数大于预置阈值,则确认所述原创微博为热门微博。本发明专利技术适用于热门微博的识别。

【技术实现步骤摘要】

本专利技术涉及信息
,特别是涉及一种热门微博的识别方法及装置。
技术介绍
随着互联网技术的不断进步与发展,微博已成为人们获取信息、交流信息的重要渠道,网民可以创建微博发表自己的意见和爆料各类新闻,或者转发其他人创建的微博。其中,在较短的时间内产生较高转发的微博为热门微博,及时地判断出热门微博具有相当大的意义。目前,判断热门微博的方式为:统计一段时间内某条微博转发数增加量,若转发数增加量大于一定阈值,则判断该微博为热门微博。然而,通过上述方案判断热门微博,通常需要跟踪一段时间内微博被转发数,即分别获取开始时间和结束时间的转发数,然而,微博转发数的快速增加可能发生在前一次跟踪时间段的结尾阶段到下一次跟踪时间段的开始阶段,因此,造成两次跟踪时间段都未能抓取到转发数的快速增加,造成识别误差较大,从而导致热门微博的识别准确性较低。
技术实现思路
有鉴于此,本专利技术提供一种热门微博的识别方法及装置,主要目的在于能够准确识别每个时刻出现的热门微博,从而能够提升热门微博的识别准确性。依据本专利技术一方面,提供了一种热门微博的识别方法:包括:获取当前微博对应的原创微博的标识信息;对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新,所述预置存储位置保存有不同原创微博的标识信息分别对应的出现次数;若更新后的所述出现次数大于预置阈值,则确认所述原创微博为热门微博。依据本专利技术另一方面,提供一种热门微博的识别装置,包括:获取单元,用于获取当前微博对应的原创微博的标识信息;更新单元,用于根据获取单元获取的原创微博的标识信息对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新,所述预置存储位置保存有不同原创微博的标识信息分别对应的出现次数;确认单元,用于若所述更新单元更新后的所述出现次数大于预置阈值,则确认所述原创微博为热门微博。借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:本专利技术实施例提供一种热门微博的识别方法及装置。通过获取当前微博对应的原创微博的标识信息,并根据当前原创微博的标识信息对应的出现次数进行热门微博识别,与目前通过统计一段时间内某条微博转发数增加量进行热门微博的判断相比,由于本专利技术实施例获取的微博为当前时刻产生的,原创微博的标识信息的出现次数也是根据当前时刻的出现次数进行更新的,当更新后的出现次数大于预置阈值,说明原创微博在较短的时间内的产生了较高的转发量,就可以判断原创微博在其当前被转发的时刻为热门微博,从而能够避免目前通过一段时间内转发数增加量识别热门微博所产生的误差,能够准确识别出每个时刻出现的热门微博,从而提升热门微博的识别准确性。附图说明图1示出了本专利技术实施例提供的一种热门微博的识别方法的流程图;图2示出了本专利技术实施例提供的另一种热门微博的识别方法的流程图;图3示出了本专利技术实施例提供的一种热门微博的识别装置的结构示意图;图4示出了本专利技术实施例提供的另一种热门微博的识别装置的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。本专利技术实施例提供了一种热门微博的识别方法,其中,本专利技术实施例所提供的一种热门微博的识别方法的执行主体,可以是服务器、移动终端或任一网络服务设备,在此不做任何限定。下面如图1所示,所述方法包括:101、获取当前微博对应的原创微博的标识信息。其中,当前微博可以为实时产生的微博。原创微博的标识信息可以为原创微博的身份标识号码(Identity,ID),例如,原创微博的标识信息为原创微博的ID:1020233637;也可以为原创微博用户的ID和原创微博发布时间的组合,例如,原创微博的标识信息为原创微博用户的ID“微博搞笑排行榜”和原创微博发布时间“2015年11点01分”的组合,本专利技术实施例不做限定。对于本专利技术实施例,步骤101具体可以为:获取当前微博信息。其中,当前微博信息中包括原创微博的标识信息。例如,当前微博为微博B,微博B信息中包括微博A的标识信息ID_A,则微博B转发自微博A,当执行主体在获取微博B时,得到的微博信息为(B-A),B表示获取的当前这条微博,A表示B的原创微博。当前微博信息可以通过网络爬虫进行获取,也可以通过微博服务提供商的数据库直接进行获取,通过调用微博服务提供商的应用程序接口(ApplicationProgrammingInterface,API)进行获取,本专利技术实施例不做限定。例如,对于新浪微博,可以通过调用新浪对第三方应用授权的API获取当前微博信息,具体地,可以通过请求的方式获取公共微博https://api.weibo.com/2/statuses/public_timeline.json上的信息,并设置请求OAuth2.0协议授权,届时就能够根据第三方应用提供的访问权限发出数据请求,获取当前微博信息。102、对预置存储位置中原创微博的标识信息对应的出现次数进行更新。其中,预置存储位置保存有不同原创微博的标识信息分别对应的出现次数。例如,新产生的微博A、微博B的原创微博均为微博C,微博C的标识信息为ID_1,当前预置存储位置保存的ID_1对应的值为6,当通过网络爬虫获取到微博A的原创微博C的标识信息ID_1时,将预置存储位置保存的ID_1对应的值更新为7;当网络爬虫获取到微博A的原创微博C的标识信息ID_1时,将预置存储位置保存的ID_1对应的值更新为8。所述预置存储位置可以为预置队列、也可以为预置栈,本专利技术实施例不做限定。103、若更新后的预置存储位置中原创微博的标识信息对应的出现次数大于预置阈值,则确认所述原创微博为热门微博。其中,预置阈值可以按实际的业务需求进行配置,也可以由系统默认配置,本专利技术实施例不做限定。例如,最近产生的微博数为100,则预置阈值配置为20,或者最近产生的微博数为200,则预置阈值配置为80等。热门微博是指在较短的时间内产生较高转发的微博。对于本专利技术实施例,热门微博的定义为最近产生的微博中,转发自相同的原创微博的微博数量大于一定的阈值,则判断原创微博在近期较短的时间内产生了较高的转发量,即该原创微博为热门微博。对于本专利技术实施例,通过在微博产生时获取原创微博的标识信息,然后更新预置存储位置中原创微博的标识信息的出现次数,当出现次数大于预置阈值时,判断原创微博为热门微博。出现次数表示最近产生的所有微博中,转发自相同原创微博的微博条数。由于在识别热门微博的整个过程中,只获取新产生的微博的原创微博的标识信息,即对每一条新产生的微博只获取一次,从而减轻了获取微博的压力。同时,由于获取的微博为实时产生的,原创微博的标识信息的出现次数也是实时进行更新的,当更新后的出现次数大于预置阈值,说明原创微博在较短的时间内的产生了较高的转发量,就可以判断原创微博在微博的发布时刻为热门微博,从而能够避免目前通过转发数增加量的识别热门微博的误差,能够准确识别出每个时刻出现的热门微博,从而提升热门微博的识别准确性。对于本专利技术实施例,具体的应用场景可以如下所示,但不限于此,包括:最近一秒内产生100条微博,设置预置阈值为20。依次获取100条微博的原创微博的标识信息,然后用原创微博的标识信息更新预置存储位置,即实时统计原创微博的标识信息对应的出现次数,若某一条原创微博的标识信息对本文档来自技高网...

【技术保护点】
一种热门微博的识别方法,其特征在于,包括:获取当前微博对应的原创微博的标识信息;对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新,所述预置存储位置保存有不同原创微博的标识信息分别对应的出现次数;若更新后的所述出现次数大于预置阈值,则确认所述原创微博为热门微博。

【技术特征摘要】
1.一种热门微博的识别方法,其特征在于,包括:获取当前微博对应的原创微博的标识信息;对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新,所述预置存储位置保存有不同原创微博的标识信息分别对应的出现次数;若更新后的所述出现次数大于预置阈值,则确认所述原创微博为热门微博。2.根据权利要求1所述的热门微博的识别方法,其特征在于,包括:所述对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新包括:对预置存储位置中所述原创微博的标识信息对应的出现次数进行累加操作。3.根据权利要求1或2所述的热门微博的识别方法,其特征在于,所述预置存储位置为预置队列,所述预置队列中保存的不同原创微博的标识信息分别对应计数器的一个键值对。4.根据权利要求3所述的热门微博的识别方法,其特征在于,所述对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新包括:对所述预置队列中所述原创微博的标识信息对应的键值对中的值进行更新,所述键值对中的键为所述原创微博的标识信息,键值对中的值为所述原创微博的标识信息对应的出现次数;所述若更新后的所述出现次数大于预置阈值,则确认所述原创微博为热门微博包括:从所述预置队列中获取更新后的所述原创微博的标识信息对应的键值对中的值;若更新后的值大于预置阈值,则确认所述原创微博为热门微博。5.根据权利要求3所述的热门微博的识别方法,其特征在于,所述对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新之前,还包括:判断所述预置队列中是否保存有所述原创微博的标识信息;若否,则在所述计数器中添加一组与所述原创微博的标识信息对应的键值对。6.根据权利要求3所述的热门微博的识别方法,其特征在于,所述对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新之前,还包括:判断所述预置队列中保存的原创微博的标识信息的数量是否达到所述预置队列的长度;若是,则将最先进入所述预置队列的原创微博的标识信息删除;将当前微博对应原创微博的标识信息添加到所述预置队列;所述对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新包括:将进行删除操作的标识信息在所述计数器中对应的值减一,并将所述当前微博的原创微博的标识信息在所述计数器中对应的值加一。7.根据权利要求1所述的热门微博的识别方法,其特征在于,当所述当前微博为原创微博时,所述获取当前微博对应的原创微博的标识信息包括:获取所述当前微博的标识信息;所述对预置存储位置中所述原创微博的标识信息对应的出现次数进行更新包括:对预置存储位置中所述当前微博的标识信息对应的出现次数进行更新。8.根据权利要求1-7任一项所述的热门微博的识别方法,其特征在于,所述预置阈值为所述预置队列长度与预置权重比例之间...

【专利技术属性】
技术研发人员:何鑫
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1