一种基于改进的PageRank的微博关键用户识别方法技术

技术编号：9596871 阅读：140 留言：0更新日期：2014-01-23 02:21

本发明专利技术公开了一种基于改进的PageRank的微博关键用户识别方法，包括输入微博信息数据，其中包括n条微博；对n条微博文本进行分词处理；根据分词结果建立倒排索引结构，便于根据指定关键词检索；根据检索到的相关微博提取其转发层级信息，构建加权有向图即转发网络G；将转发网络G划分为若干个极大连通子图Gi；利用并行化计算技术在每个子网络Gi应用PageRank算法；将各个子网络的计算结果融合生成整个网络生成整个网络G的排序结果；将排序结果选择前m条作为关键用户输出。本发明专利技术采用并行计算技术，在大数据环境下针对微博平台的动态转发网络进行排序计算，从而识别信息传播过程中的关键用户，应用于网络舆情分析等领域。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了，包括输入微博信息数据，其中包括n条微博；对n条微博文本进行分词处理；根据分词结果建立倒排索引结构，便于根据指定关键词检索；根据检索到的相关微博提取其转发层级信息，构建加权有向图即转发网络G；将转发网络G划分为若干个极大连通子图Gi；利用并行化计算技术在每个子网络Gi应用PageRank算法；将各个子网络的计算结果融合生成整个网络生成整个网络G的排序结果；将排序结果选择前m条作为关键用户输出。本专利技术采用并行计算技术，在大数据环境下针对微博平台的动态转发网络进行排序计算，从而识别信息传播过程中的关键用户，应用于网络舆情分析等领域。【专利说明】—种基于改进的PageRank的微博关键用户识别方法
本专利技术涉及微博关键用户识别方法，特别是，属于复杂网络和数据挖掘领域，特别针对海量的微博数据分析。
技术介绍
微博平台关键用户是对信息的传播与扩散起到重要作用的用户。关键用户在大众传播效果的形成过程中起着重要的中介或过滤的作用，他们将信息扩散给受众，形成信息的级联传播。因此，关键用户的识别在信息的发现以及传播分析方面起到重要的作用，对...

【技术保护点】
基于改进的PageRank的微博关键用户识别方法，其特征在于，包括以下步骤：步骤一，输入微博信息数据，其中包括n条微博的用户、文本、时间信息等；步骤二，根据含有m个词汇的预设词库，对n条微博的文本进行分词处理；步骤三，根据分词后的结果建立倒排索引结构，便于根据指定关键词检索；步骤四，根据检索到的相关微博提取其转发层级信息，构建加权有向转发网络G；步骤五，将转发网络G划分为若干个极大连通子图Gi；步骤六，在各个子网络上分别采用并行计算技术，应用PageRank算法得出各个子网络的排序结果后再融合；步骤七，排序结果输出。

【技术特征摘要】

【专利技术属性】
技术研发人员：程工，刘春阳，张旭，庞琳，吴俊杰，韩洋，刘洪甫，韩小汀，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人