【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,其包括以下步骤:微博采集模块根据采集策略,使用网络爬虫与微博第三方api技术相结合的方式获取微博数据;利用分词处理技术从词库中调用关键词和敏感词,从微博文本数据中分析出关键词和敏感词;依据分析出的关键词、敏感词以及情感倾向词对微博网页文本数据进行过滤;热点话题模块通过聚类分析技术将##与[]符号之间括住的内容,标记为一个话题,以统计微博评论数;热点人物模块通过聚类分析技术以分析微博粉丝数量、评论数量;微博预警模块从网络微博中分析出与关键字和敏感词有关的微博信息;分析统计模块对系统中分析出的相关数据自动生成简报。本专利技术提高了话题分析的准确性,提高了检测效率。【专利说明】
本专利技术涉及一种分析方法,特别是涉及一种。。
技术介绍
微博是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。微博作为快速分享和传播的网络平台,具有信息量庞大、信息分散多样等特点。在国内,新浪微博和腾讯微博是最热门的微博系统,据公开数据,新浪有超过 ...
【技术保护点】
一种微博热点话题分析方法,其特征在于,所述微博热点话题分析方法包括以下步骤:步骤一,微博采集模块根据采集策略,使用网络爬虫与微博第三方api技术相结合的方式获取微博数据;步骤二,利用分词处理技术从词库中调用关键词和敏感词,从微博文本数据中分析出关键词和敏感词;步骤三,依据分析出的关键词、敏感词以及情感倾向词对微博网页文本数据进行过滤,存储过滤记录;步骤四,热点话题模块通过聚类分析技术将##与[]符号之间括住的内容,标记为一个话题,以统计微博评论数和转发次数等为依据,分析出当前的热点话题,大大提高了话题分析的准确性;步骤五,热点人物模块通过聚类分析技术以分析微博粉丝数量、评论 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:肖江,严时浪,肖伦文,
申请(专利权)人:上海锐英软件技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。