一种基于标签的社交网络用户兴趣挖掘方法与装置制造方法及图纸

技术编号:8190978 阅读:414 留言:0更新日期:2013-01-10 01:52
本发明专利技术涉及一种基于标签的社交网络用户兴趣挖掘方法与装置,包括:收集用户在社交网络上的所有数据;其中,所述数据包括:社交网络上用户生成的文字性数据和社交网络上用户与文字性内容的关联关系数据;获取所述用户生成的文字性数据包含的所有标签和每个标签所对应地权重分;将所述用户与文字性内容的关联关系数据转换为用户-关系链形式;合并用户在所有内容上的标签得到用户的标签兴趣列;将所述标签兴趣列向量化;将标签兴趣向量抽象化得到低级类目兴趣向量和高级类目兴趣向量;根据应用场景的具体需要,按照低级类目兴趣向量、高级类目兴趣向量和标签为社交网络用户提供相应的兴趣信息,实现社交网络用户兴趣挖掘。

【技术实现步骤摘要】

本专利技术涉及互联网信息挖掘领域,特别涉及一种基于标签的社交网络用户兴趣挖掘方法与装置
技术介绍
现有的用户兴趣获取和应用的方法主要分为如下几个不同的体系I、关联体系这个体系的方法利用用户和实体之间产生的直接关联,采用协同过滤等从众方法,将用户可能感兴趣、但尚未发生关联的实体和该用户关联起来。优点简单明了,对从众性的用户和实体往往能够取得不错的判断结果; 缺点不能对小众用户的兴趣进行判断;不能直接定义用户的兴趣,只能针对具体实体判断用户的喜好程度。2、实体标签体系这个体系采用的技术手段是在实体出现的位置提供输入,引导用户对实体进行简短描述,将这些简短描述语收集并作为该实体的标签。优点代价小,仅仅需要提供功能,标签由用户生成;缺点标签无法规范,利用难度大;用户大都不愿填写;对于单个实体,收集的标签数量少,描述也不完整;无法直接对用户兴趣进行描述。3、分类体系这个体系设定一些用户兴趣的类目,在用户注册或首次使用产品的时候,要求用户从中选择几个感兴趣的类目,以此作为用户兴趣的判定;优点用户抵触小,能够直接定义用户兴趣;缺点必须事先对实体同样做分类映射,如果实体数量较多,会面临映射代价大本文档来自技高网...

【技术保护点】
一种基于标签的社交网络用户兴趣挖掘方法,其特征在于,包括:收集用户在社交网络上的数据;根据数据生成标签兴趣列;所述标签兴趣列为所述数据中所有标签及标签对应地权重的集合;根据标签兴趣列进行用户兴趣信息推荐,以实现社交网络用户兴趣挖掘。

【技术特征摘要】

【专利技术属性】
技术研发人员:薛晔伟马振江伍星
申请(专利权)人:北京开心人信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1