一种基于矩阵分解对在线论坛用户影响力进行计算的方法技术

技术编号：6959996 阅读：296 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种利用计算机基于矩阵特征向量分解对互联网论坛(BBS)中用户的影响力进行自动计算和排名的方法，其中包括：采集论坛文章信息，包括每个对话的主题作者和回帖作者，对用户进行编号；按照领域关键字对主题文章内容进行筛选；根据回复的关系将文章用户进行关联，构成有向无环图，进一步表示成一个邻接矩阵；对该邻接矩阵进行特征向量分解，得到主特征向量，向量每一个元素的值为编号为对应下标的用户的影响力数值；对用户的影响力数值进行排序，即可得到用户影响力的排名。通过本发明专利技术，可以对论坛上的用户在一般意义上或者特定领域上的影响力进行计算和排名，能够更加准确的反映每个用户的观点影响到其他用户的可能性，同时结果不会被各类广告贴或者恶意频繁点击等行为干扰。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种对在线论坛用户影响力进行计算和排名的方法，属于对互联网信息进行自动采集和处理的技术。
技术介绍
随着互联网用户的不断增加，以及各类在线论坛的发展等，用户在在线论坛上的各种讨论话题也愈加深入和广泛，因此针对在线论坛的用户进行影响力的计算和排名具有潜在的科研和商业价值。特别的，拥有几万乃至几十万用户的在线论坛并不鲜见，因此只有基于计算机程序的计算方法才具备实用意义。
技术实现思路
本专利技术要解决的问题是对在线论坛上每个用户的观点影响到他人的可能性(简称为影响力)进行自动计算和排名。现有评价用户在论坛上影响力的方法是依据两项简单和直观的数据1.发表文章数；2.文章点击率。文章发表数和文章点击率这两项数据可以从论坛的数据库中直接获取，但是用于评价用户影响力有很大的局限和漏洞。譬如1. 一些用户虽然发表的文章总数不多，但是因为文章质量很高，能吸引很多其他用户参与讨论；因此尽管这类用户的文章发表总数或者点击率都未必非常高，但是实际上他们很大程度上是可能利用自己的观点影响其他用户的；2.在现实中，一些个人或者商业机构会大量发表各类广告贴来提高文章发表数，或者通过人为或自动的方式来不断打开自己发表的文章(俗称“刷贴”)来提高自己的文章点击率；这些用户虽然有很高的文章发表数或者点击率，但是他们实际上对论坛上其他用户的影响力是很小的。因此简单的采用这两个数据是不能够准确反映用户的实际影响力的，同时无法避免被一些恶意行为所干扰影响结果。为了解决上述问题，本专利技术的一个实施例提供了一种对在线论坛上用户的影响力进行计算和排名的方法，方法所获得的影响力取决于三个...

【技术保护点】
１．一种分析在线论坛用户发表的文章以及相互间回复关系，对用户对其他用户的影响程度（简称影响力）进行计算和排名的方法，其特征在于：具有：采集论坛上的文章内容以及文章的作者用户名；对用户进行唯一编号；记录用户之间的回复关系；根据用户间回复关系建立邻接矩阵；对邻接矩阵进行特征向量分解，求得最大特征向量，其中每个元素对应相应编号用户的影响力数值；对用户按照各自影响力数值进行排名。

【技术特征摘要】

【专利技术属性】
技术研发人员：王捷，
申请(专利权)人：上海佳艾商务信息咨询有限公司，
类型：发明
国别省市：31

全部详细技术资料下载我是这个专利的主人