A second-order impact assessment method based on micro-blog users themselves and behavior value belongs to the field of computer data mining technology. It includes: (1) collecting microblog data by using crawler technology and microblog official API interface; (2) processing the collected data to obtain the required user's eigenvectors; (3) calculating the user's own value through the user's own value of all fans; (4) calculating the user's behavior value through the user's behavior value of all push forwarders; (5) synthesizing the user's own and behavior value. Calculate the ultimate impact of users. By calculating the number and quality of users'fans and the behavior quality of users pushing micro-blogs, the invention avoids the false influence caused by zombie powder and salesmen, and highlights the hidden influence of users who push less but have high quality; it has the functions of discovering the dissemination law of information, advertising, viral marketing and public opinion control in micro-blog platform, etc. Significance.
【技术实现步骤摘要】
一种基于微博用户自身和行为价值二阶的影响力评估方法
本专利技术属于计算机数据挖掘
,具体涉及一种基于微博用户自身和行为价值二阶的影响力评估方法。
技术介绍
随着Web2.0技术的发展和成熟加速了社交网络媒体平台的普及和多样化,微博以其极快的内容获取和更新速度获取了大量用户,跃身成为国内最大的社交媒体平台。因此对微博中高影响力节点的挖掘算法研究有助于发现微博平台中内容信息的传播规律,可以为相应的企业用户、管理者用户进行广告投放、病毒式营销和舆情管控等提供可靠实时的理论数据依据。目前,常见方法都是从以下3个角度对社会网络高影响力节点进行挖掘:第一基于拓扑结构的特征度量,局部属性如节点的度中心性,全局属性如节点的紧密中心性、介数中心性等,基于随机游走的度量PageRank、HITS等算法通过对网络结构中的用户节点打分来区分用户影响力的大小;第二基于行为的特征度量,如传播范围分析、用户活跃度分析;第三基于内容的特征度量,如话题分析、相似性分析等。然而上述方法大多是从单方面去评价用户影响力,即使结合多个角度去计算也与现实结果存在差异,方法的时间复杂度和准确性有待优化。
技术实现思路
本专利技术的目的在于提供一种基于微博用户自身和行为价值二阶的影响力评估方法,最大可能性的避免了僵尸粉、推销商造成的虚假影响力又突出了推送较少但质量极高的用户的隐藏影响力。相较于其他方法花费时间更少,准确度更高。从而为相应的企业用户、管理者、学术研究者更加准确快速的挑选更具影响力的微博用户。本专利技术的目的是这样实现的:一种基于微博用户自身和行为价值二阶的影响力评估方法,包括如下步骤:步 ...
【技术保护点】
1.一种基于微博用户自身和行为价值二阶的影响力评估方法,其特征在于,包括:(1)利用爬虫技术和微博官方API接口采集微博数据;(2)对步骤(1)中采集的数据进行处理,包括用户静态属性的清理,用户动态行为信息的筛选,得到方法所需用户的特征向量;(3)通过用户所有粉丝的自身价值来计算该用户的自身价值;(4)通过用户所有推送转发者的行为价值来计算用户的行为价值;(5)综合用户的自身与行为价值计算用户最终的影响力。
【技术特征摘要】
1.一种基于微博用户自身和行为价值二阶的影响力评估方法,其特征在于,包括:(1)利用爬虫技术和微博官方API接口采集微博数据;(2)对步骤(1)中采集的数据进行处理,包括用户静态属性的清理,用户动态行为信息的筛选,得到方法所需用户的特征向量;(3)通过用户所有粉丝的自身价值来计算该用户的自身价值;(4)通过用户所有推送转发者的行为价值来计算用户的行为价值;(5)综合用户的自身与行为价值计算用户最终的影响力。2.根据权利要求1所述的一种基于微博用户自身和行为价值二阶的影响力评估方法,其特征在于:所述的步骤(1)中,利用爬虫技术采集微博数据后,按照话题分类采集用户和用户关注者、粉丝的全部信息。3.根据权利要求1所述的一种基于微博用户自身和行为价值二阶的影响力评估方法,其特征在于:所述的步骤(2)中,用户静态属性的清理具体指清理出采集到数据中用户粉丝ID、数量、推送微博ID、数量、转发者ID;用户动态行为信息...
【专利技术属性】
技术研发人员:杨静,马博文,张健沛,王勇,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。