一种面向微博热门话题社区的动态预测方法及系统技术方案

技术编号:8682801 阅读:257 留言:0更新日期:2013-05-09 02:44
本发明专利技术涉及社会化媒体数据分析与挖掘领域,公开了一种面向微博热门话题社区的动态预测方法,包括:获取微博的热门话题社区数据;对交互数据进行形式化建模,并定义其对应的矩阵;生成融合各种历史交互行为的预测模型;根据热门话题社区的历史数据进行模型参数求解;以及对社区进行预测并输出结果。另外,本发明专利技术还公开了一种面向微博热门话题社区的动态预测系统。所述方法和系统能有效获取热门话题的社区数据,并基于预测模型,充分利用热门话题社区的历史数据进行预测,从而获得较高的预测准确率,能较佳地为运营商或政府提供辅助决策支持。

【技术实现步骤摘要】

本专利技术属于社会化媒体数据分析与挖掘领域,尤其涉及一种面向微博热门话题社区的动态预测方法及系统
技术介绍
社会网络分析与挖掘,成为近几年学术界和产业界的热门研究领域,社区结构研究则是其中一个非常重要的研究课题。当前对社区结构的研究往往集中于静态层面,即给定一个网络,如何去发现其中隐藏的社区结构。然而,事实上,社会网络是不断变化的,社区结构也会随着网络的变化而演化。然而,本专利技术的专利技术人发现,到目前为止,业界还未有针对动态变化的社区进行预测的方法。
技术实现思路
有鉴于此,本专利技术实施例提供一种面向微博热门话题社区的动态预测方法及系统,旨在解决当前未有针对动态变化的社区进行预测的问题。为此,本专利技术实施例提供了如下技术方案:一种面向微博热门话题社区的动态预测方法,包括:获取微博的热门话题社区数据;对交互数据进行形式化建模,并定义其对应的矩阵;生成融合各种历史交互行为的预测模型;根据热门话题社区的历史数据进行模型参数求解;以及对社区进行预测并输出结果。另外,本专利技术实施例还进一步提供了如下技术方案:一种面向微博热门话题社区的动态预测系统,包括:数据获取模块,用于获取微博的热门话题社区数据;建模模块,用于对交互数据进行形式化建模,并定义其对应的矩阵;预测模型生成模块,用于生成融合各种历史交互行为的预测模型;参数求解模块,用于根据热门话题社区的历史数据进行模型参数求解;以及预测及输出模块,用于对社区进行预测并输出结果。相对于现有技术,本专利技术实施例提供的面向微博热门话题社区的动态预测方法及系统能有效获取热门话题的社区数据,并基于预测模型,充分利用热门话题社区的历史数据进行预测,从而获得较高的预测准确率,能较佳地为运营商或政府提供辅助决策支持。附图说明图1是本专利技术第一实施例提供的面向微博热门话题社区的动态预测方法的流程图2是基于腾讯微博开放平台的主题微博数据获取流程图;图3是腾讯微博的主题社区数据获取界面图;图4是通过图3获取到的数据格式示意图;图5是第一实施例构建的模型随着K值的变化在四种数据集上的预测性能示意图;图6是本专利技术第二实施例提供的面向微博热门话题社区的动态预测系统的结构示意图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要指明的是,本专利技术实施例是基于微博开放平台(如腾讯微博开放平台)来获取具有专题特性的微博数据,从而进行的社区预测。微博,即微博客(Micro Blog)的简称,目前尚未有统一的定义,有学者将微博定义成一种通过关注机制分享简短实时信息的广播式社交网络平台,并指出微博的四个重要特点:(I)关注机制:可单向可双向;(2)简短内容:通常为140字;(3)实时信息:最新的实时信息;(4)广播式:公开的信息,任何人都可以浏览。微博兼具媒体和沟通工具的双重性质,用户可以通过电脑、手机、PDA (Personal Digital Assistant,掌上电脑)等各种终端随时发布个人看法或信息,从而进行实时实地分享与沟通。在腾讯微博中,用户A可以收听任何一个他/她感兴趣的用户B,而被收听的用户B不必收听用户A。作为收听者,用户A能查阅所有他/她收听的用户的微博内容(消息)。此外,在腾讯微博中,具有显式的社区结构,对某一话题感兴趣的用户会参与到该话题的讨论中,分享个人观点、浏览别人的微博、撰写评论、转播某个新闻或微博等。腾讯微博提供了一个开放平台API应用程序接口,便于进行微博数据的收集。腾讯微博开放平台,是基于腾讯微博系统,为广大开发者和用户提供的开放数据分享与传播平台。广大开发者和用户登录平台后,就可以使用平台提供的开放API接口,创建应用从微博系统获取信息,或将新的信息传播到整个微博系统中。实施例一图1是本专利技术第一实施例提供的一种面向微博热门话题社区的动态预测方法的方法流程图,其包括步骤101至步骤105。步骤101:获取微博的热门话题社区数据;步骤102:对交互数据进行形式化建模,并定义其对应的矩阵;步骤103:生成融合各种历史交互行为的预测模型;步骤104:根据热门话题社区的历史数据进行模型参数求解;以及步骤105:对社区进行预测并输出结果。请一起参阅图2-图5,下面将结合具体实施方式对上述方法进行说明。在步骤101中,可基于腾讯微博开放平台获取具有专题特性的微博数据,获取流程如图2所示,具体包括:(I)、根据腾讯开放平台提供的权限设定权限参数,进行权限验证。在本实施例中,主要是依据腾讯开放平台提供的权限和权限验证方法进行设定,设定成功时获取数据,否则需要更换权限密钥。(2)、通过参数设定和主题设定确定出需要获取的微博数据,然后对微博数据进行抓取,并对抓取到的数据进行内容分析和数据存储,具体是将其存储至数据库中。(3)、通过参数更新从而进入下一个循环,直至该主题下的所有微博数据全部抓取到为止。图3为腾讯微博的主题社区数据获取界面图,图4为抓取到的数据格式。在步骤102中,首先给出数据的形式化定义,然后给出问题的形式化定义,其中数据的形式化定义包括以下定义1-定义5。定义1:时序状态矩阵(Temporal State Matrix)定义Ytxn为一个时序状态矩阵,表示社区结构的时序状态。其中,T表示社区所持续的时间片总数,N表示该社区所涉及的成员总数,矩阵的元素表示每个成员在每个时刻下的状态:本文档来自技高网...

【技术保护点】
一种面向微博热门话题社区的动态预测方法,包括:获取微博的热门话题社区数据;对交互数据进行形式化建模,并定义其对应的矩阵;生成融合各种历史交互行为的预测模型;根据热门话题社区的历史数据进行模型参数求解;以及对社区进行预测并输出结果。

【技术特征摘要】
1.种面向微博热门话题社区的动态预测方法,包括: 获取微博的热门话题社区数据; 对交互数据进行形式化建模,并定义其对应的矩阵; 生成融合各种历史交互行为的预测模型; 根据热门话题社区的历史数据进行模型参数求解;以及 对社区进行预测并输出结果。2.权利要求1所述的面向微博热门话题社区的动态预测方法,其特征在于,所述获取微博的热门话题社区数据包括: 根据开放平台提供的权限设定权限参数,进行权限验证; 通过参数设定和主题设定确定出需要获取的微博数据,并对微博数据进行抓取。3.权利要求2所述的面向微博热门话题社区的动态预测方法,其特征在于,所述获取微博的热门话题社区数据进一步包括:对参数进行更新。4.权利要求1所述的面向微博热门话题社区的动态预测方法,其特征在于,所述对交互数据进行形式化建模,并定义其对应的矩阵,包括:时序状态矩阵、交互流、时序行为矩阵、时序收听矩阵、以及时序交互矩阵的形式化定义。5.权利要求1所述的面向微博热门话题社区的动态预测方法,其特征在于,所述生成融合各种历史交互行为的预测模型是基于logistic创建的K-历史模型。6.种面向微博热门话题社区...

【专利技术属性】
技术研发人员:赵中英张涌李超冯圣中樊建平
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1