社交平台下的领域专家发现方法和装置制造方法及图纸

技术编号:9765907 阅读:151 留言:0更新日期:2014-03-15 11:37
本发明专利技术公开了一种社交平台下的领域专家发现方法和装置,所述方法包括:对于一个领域,确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝;对于查找出的优质粉丝所关注的每个用户,计算该用户与该领域的相关度;选取N个与该领域的相关度最大的用户作为该领域的专家。应用本发明专利技术,可以使得发现领域专家的过程既简单又准确。

【技术实现步骤摘要】
社交平台下的领域专家发现方法和装置
本专利技术涉及互联网技术,尤其涉及一种社交平台下的领域专家发现方法和装置。
技术介绍
随着互联网技术的发展,通过社交平台来进行信息的分享、传播以及获取,已成为广大网民的主要社交方式之一。例如,通过微博或Twitter (推特)等社交平台,用户可以通过各种客户端组建个人社区,以140字左右的文字更新信息,并实现将自己的最新动态和想法即时分享。而UGC (User Generated Content,用户生成内容)标签就是在社交平台环境下由用户生成的描述了用户的身份、性格、兴趣情感等内容的标签。实际应用中,在社交平台下,如何自动挖掘某个领域下的专家用户是个很基础且重要的问题。如果能够对于某个领域的专家进行准确的挖掘,对于很多上层应用来说都有很好的作用,比如可以利用挖掘结果为社交平台用户推荐其感兴趣的领域专家;或者为专家搜索提供基础服务等。领域专家的传统发现方法是采用基于内容的信息检索技术来确定领域专家。具体地,以微博为例,在微博环境下,给定一个领域的关键词后,根据用户的博文内容,统计出该关键词出现在该用户的博文内容中的出现概率;结合统计出的出现概率以及预先建立的语言模型,确定出该用户在该领域成为专家的概率;最后,可以按照各用户在该领域成为专家的概率的大小排序找到该领域的专家。在上述传统的领域专家发现方法中,需要分析所有用户的博文内容才能得到某一领域的关键词出现在一个用户的博文内容中的出现概率,而实际应用中用户的博文内容是由用户生成的多媒体数据,形式复杂、歧义多,因此,博文内容分析难度大,使得传统的领域专家发现方法算法复杂、运行速度慢。现有还提出了一种改进的领域专家发现方法,即利用网络节点之间的链接结构确定节点的重要性的方法。具体地,以微博为例,在微博环境下,将用户看作一个节点,用户之间的关注关系看作边,即可形成一个有向网络,根据各用户之间的关注关系,使用pagerank(网页级别)算法可找到各用户的权威度排序,将权威度排序靠前的用户作为领域专家。虽然,基于pagerank算法的领域专家发现方法避免了分析社交平台下的每个用户的博文内容,降低了发现领域专家的复杂度。但是,使用pagerank算法在社交平台上进行用户节点排序,忽略了用户与领域的相关性,使得发现的领域专家的准确性不高。实际应用中,对于一个领域,还可以预先将少量的领域专家作为种子专家,然后通过HITS (Hyperlink-1nduced Topic Search,基于超链接分析的主题搜索)算法,根据种子专家的关注关系,可找到各种子专家所关注的用户的权威度排序,将权威度排序靠前的用户作为该领域的领域专家,并将发现的领域专家作为下一次发现过程的种子专家,以得到该领域更多的领域专家。HITS算法虽然与领域密切相关,但是社交平台下的用户社交关系链接不完全等同于网页的超级链接关系,所以每次发现的领域专家是与该次发现过程中的种子专家具有直接链接指向关系的用户。然而,社交平台是自媒体,用户多是倾向于宣传自己的观点言论等,领域内的专家不一定也大量关注其他专家,所以基于HITS算法的领域专家发现方法存在准确性不高的不足。综上所述,现有的领域专家发现方法存在算法复杂、运行速度慢,以及准确性不高的不足。
技术实现思路
本专利技术实施例提供了一种社交平台下的领域专家发现方法和装置,用以使得发现领域专家的过程既简单又准确。根据本专利技术的一个方面,提供了一种社交平台下的领域专家发现方法,包括:对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝;从查找出的优质粉丝所关注的用户中选取出该领域的其它专家。较佳地,所述领域的种子专家是预先确定出的:将至少一个UGC标签与预先设定的该领域的关键词标签相同的所述社交平台下的用户作为该领域的相关用户;确定该领域的各相关用户之间的关注关系;使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序;将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。较佳地,所述查找所述社交平台下该领域的种子专家的优质粉丝,具体包括:确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝。较佳地,所述从查找出的优质粉丝所关注的用户中选取出该领域的其它专家,具体包括:对于查找出的优质粉丝所关注的每个用户,计算该用户与该领域的相关度;选取N个与该领域的相关度最大的用户作为该领域的其它专家。较佳地,所述计算该用户与该领域的相关度,具体包括:根据如下公式I计算出该用户与该领域的相关度DC:DC=F (X,Y) /F (X) *F (Y)(公式 I)其中,F(X)是指该用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该用户的粉丝中属于该领域的种子专家的优质粉丝的数量。较佳地,在所述选取出该领域的其它专家后,还包括:将选取出的该领域的其它专家作为该领域的种子专家。根据本专利技术的另一个方面,还提供了一种社交平台下的领域专家发现装置,包括:优质粉丝确定模块,用于对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝;领域专家确定模块,用于从所述优质粉丝确定模块查找出的优质粉丝所关注的用户中选取出该领域的其它专家。较佳地,所述社交平台下的领域专家发现装置还包括:种子专家确定模块,用于将至少一个UGC标签与预先设定的该领域的关键词标签相同的所述社交平台的用户作为该领域的相关用户;确定该领域的各相关用户之间的关注关系;使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序;将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。较佳地,所述优质粉丝确定模块具体用于确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝。较佳地,所述领域专家确定模块具体用于对于查找出的优质粉丝所关注的每个用户,根据如下公式I计算该用户与该领域的相关度DC:DC=F (X,Y) /F (X) *F (Y)(公式 I)其中,F(X)是指该用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该用户的粉丝中属于该领域的种子专家的优质粉丝的数量;以及所述领域专家确定模块选取N个与该领域的相关度最大的用户作为该领域的其它专家。本专利技术实施例的技术方案中,对于一个领域,可以查找社交平台下该领域的种子专家的优质粉丝;从查找出的优质粉丝所关注的用户中选取出该领域的其它专家。这样,避免了分析社交平台下各个用户的博文内容,简化了领域专家的发现过程;而且,相比现有直接将忽略用户与领域的相关性的权威用户,或是将针对领域的种子专家所关注的用户作为领域专家的方法,通过针对某一领域的种子专家的优质粉丝所关注的用户来确定该领域的专家的方法更为准确。【附图说明】图1为本专利技术实施例的种子专家确定的方法的流程图;图2为本专利技术实施例的社交平台下的领域专家发现方法的流程图;图3为本专利技术实施例的社交平台下的领域专家发现装置的结构示意图。【具体实施方式】为使本发本文档来自技高网
...

【技术保护点】
一种社交平台下的领域专家发现方法,其特征在于,包括:对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝;从查找出的优质粉丝所关注的用户中选取出该领域的其它专家。

【技术特征摘要】
1.一种社交平台下的领域专家发现方法,其特征在于,包括: 对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝; 从查找出的优质粉丝所关注的用户中选取出该领域的其它专家。2.如权利要求1所述的方法,其特征在于,所述领域的种子专家是预先确定出的: 将至少一个UGC标签与预先设定的该领域的关键词标签相同的所述社交平台下的用户作为该领域的相关用户; 确定该领域的各相关用户之间的关注关系; 使用Pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序; 将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。3.如权利要求1所述的方法,其特征在于,所述查找所述社交平台下该领域的种子专家的优质粉丝,具体包括: 确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝。4.如权利要求1所述的方法,其特征在于,所述从查找出的优质粉丝所关注的用户中选取出该领域的其它专家,具体包括: 对于查找出的优质 粉丝所关注的每个用户,计算该用户与该领域的相关度; 选取N个与该领域的相关度最大的用户作为该领域的其它专家。5.如权利要求4所述的方法,其特征在于,所述计算该用户与该领域的相关度,具体包括: 根据如下公式I计算出该用户与该领域的相关度DC:DC=F (X,Y) /F (X) *F (Y)(公式 I) 其中,F(X)是指该用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该用户的粉丝中属于该领域的种子专家的优质粉丝的数量。6.如权利...

【专利技术属性】
技术研发人员:昝艳谌贻荣
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1