【技术实现步骤摘要】
本专利技术属于数字信息处理
,具体涉及一种社交媒体网络的数据筛选技术,特别是基于多媒体内容与链接分析的主题敏感有影响力用户的筛选方法。
技术介绍
社交媒体网络的出现和繁荣发展,改变了人们获取和消费信息的方式。各种社交媒体网络为人们提供了一个可以便捷创造和分享兴趣内容的平台。比如,新浪、腾讯微博的短讯图片分享,twitter的短讯,Flickr的图片分享等。然而,一个显著的存在问题是,人们在便捷获取信息的同时,也面临信息过载的问题。人们获取信息时,会倾向于获取自己感兴趣的内容和把有影响力的用户作为信息源。从社交媒体网络中筛选出在某一领域或主题下有影响力的用户或是兴趣对象,成为当前学术界和工业界关注的热点。通过筛选出主题敏感的用户,一种“兴趣达人”或“意见领袖”,从而商家可以进行影响力营销推广,用户可以更好地有目标性地获取所感兴趣所需要的知识信息。目前针对有影响力用户的筛选,现有的方法有一种是专家发现方法,即给定一个主题,鉴别出有相关的技能或经验的人。现有的工作主要集中在文本数据上,没有涉及多媒体数据,即各种用户感兴趣的信息载体,比如音频、图片、视频等。另一种 ...
【技术保护点】
一种在社交媒体网络上自动筛选有影响力用户的方法,其特征在于,该方法包括步骤如下:步骤S1:利用超图模型为兴趣社交媒体网络中的用户、兴趣对象及其相互作用关系建模;步骤S2:采用超图约束的正则化主题概率模型,利用兴趣对象的内容信息和内容信息之间的相似性关系作为约束,自动学习得到隐含的兴趣主题;步骤S3:对每个用户和兴趣对象进行主题影响力排序,采用相似性传播模型及在超图上的用户和兴趣对象及相互之间的超边传播主题影响力,直到稳态,然后排序可得到特定主题下的有影响力的用户。
【技术特征摘要】
1.一种在社交媒体网络上自动筛选有影响力用户的方法,其特征在于,该方法包括步骤如下 步骤S1:利用超图模型为兴趣社交媒体网络中的用户、兴趣对象及其相互作用关系建模; 步骤S2 :采用超图约束的正则化主题概率模型,利用兴趣对象的内容信息和内容信息之间的相似性关系作为约束,自动学习得到隐含的兴趣主题; 步骤S3 :对每个用户和兴趣对象进行主题影响力排序,采用相似性传播模型及在超图上的用户和兴趣对象及相互之间的超边传播主题影响力,直到稳态,然后排序可得到特定主题下的有影响力的用户。2.根据权利要求1所述的在社交媒体网络上自动筛选有影响力用户的方法,其特征在于,所述步骤SI包括用超图节点表示社交媒体网络中的用户和兴趣对象,用同质超边表示兴趣对象之间的内容相似性,用异质超边表示用户和兴趣对象之间的高阶社交链接关系。3.根据权利要求2所述的在社交媒体网络上自动筛选有影响力用户的方法,其特征在于,所述兴趣对象之间的内容相似性包括视觉内容相似性和文本内容相似性,并且, 用于表示视觉内容相似性的超边构建步骤为对于每一个兴趣对象,找到其K个最近邻的兴趣对象,然后用一条同质超边连接这些节点,并且权重设为I ; 用于表示文本内容相似性的超边构建步骤为首先从所有兴趣对象的文本元数据抽取一个词典,然后对于每一个词,为所有包含该词...
【专利技术属性】
技术研发人员:徐常胜,桑基韬,方全,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。