【技术实现步骤摘要】
【专利摘要】本专利技术提出了一种微博信息追踪方法和一种微博信息追踪装置,其中微博信息追踪方法包括预设训练集合,其中,训练集合包括至少一个话题、前景语料和背景语料,前景语料为在话题发生的时间戳之后发布的信息,背景语料为在话题发生的时间戳之前发布的微博信息;获取话题的前景语料中每一条微博信息的文本特征、相关反馈特征和相关性特征,以得到有关于训练集合的特征集合;根据特征集合训练生成话题追踪模型;使用话题追踪模型对需进行追踪的微博信息进行追踪。本专利技术能够从海量的实时微博信息流中过滤出与话题相关的微博信息,提高话题追踪的准确率。【专利说明】微博信息追踪方法和微博信息追踪装置
本专利技术涉及计算机
,具体而言,涉及微博信息追踪方法和微博信息追踪 装直。
技术介绍
近年来,随着移动互联网在世界范围内的迅速普及和蓬勃发展,实时的互联网络在人们的日常生活中越来越普遍。作为一种新兴的社交网络媒体,微博客(简称微博),正逐渐取代博客,成为人们分享、传播和获取信息的新平台,典型的代表有美国注明微博客Twitter和国内的新浪微博。微博客是一种广播形式的博客,用户可以 ...
【技术保护点】
一种微博信息追踪方法,其特征在于,包括:预设训练集合,其中,所述训练集合包括至少一个话题、前景语料和背景语料,所述前景语料为在所述话题发生的时间戳之后发布的微博信息,所述背景语料为在所述话题发生的时间戳之前发布的微博信息;获取所述话题的前景语料中每一条微博信息的文本特征、相关反馈特征和相关性特征,以得到有关于所述训练集合的特征集合;根据所述特征集合训练生成话题追踪模型;使用所述话题追踪模型对需进行追踪的微博信息进行追踪。
【技术特征摘要】
【专利技术属性】
技术研发人员:洪毅虹,费跃,杨建武,
申请(专利权)人:北京大学,北大方正集团有限公司,北京北大方正电子有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。