一种基于用户标签算法制造技术

技术编号：18350443 阅读：31 留言：0更新日期：2018-07-01 23:40

本发明专利技术公开了一种基于用户标签算法，通过获取Herpink平台用户信息，对用户信息进行定量化分析，用户信息包括以下内容：分析关注用户的人数、用户的粉丝数量和发布的留言为标准，根据分析结果，针对不同特征的用户群体提出了相应的标签推荐方法，为用户提供更好的影响力，为粉丝选择更好的、更喜欢的关注对对象，这样可以提高用户的更大价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户标签算法
本专利技术主要将用户标签和用户兴趣相结合，建立用户兴趣模型和用户属性描述，为用户进行个性化兴趣推荐，主要为用户推荐感兴趣的标签或为用户推荐感兴趣的用户。
技术介绍
在用户兴趣点相似或关注用户的标签里，计算用户与标签的联系程度；并不是所有存在于—点内的标签都可以很好的反映出用户的真实兴趣。例如，一个用户兴趣推荐系统中，用户可能会对某个美食大V标签反映自己对这个用户评价的标签，比如：我很喜欢这道“菜”，看上去很有“味道”，我就是一个“吃货”。但是，对于系统来说不能够因为用户标记了“菜”这个标签，就认为这个是用户的兴趣偏好。因此需要计算用户与该标签的联系程度来推断该标签是否能够真正的描述用户的兴趣偏好。在标签系统中，一个标签在系统中出现的频率越低，但是某一用户使用该标签的频率越高，则这个标签越能描述该用户的兴趣偏好。这一特点刚好与传统算法的核心思想一致，因此在计算用户与该标签的联系程度时引入算法。本专利利用基于相似性的聚类方法将用户使用过的标签进行聚类，将用户的兴趣利用一类标签来进行描述；具体步骤如下：计算该用户所使用过的所有标签之间的相似性；根据设定的阈值，将标签进行聚类，生成若干能够描述用户兴趣点的标签集合。最终生成的用户u的整体兴趣模型Hu可以用一个k维向量进行表示：Hu＝(interest1,interest2,…,interestk)，其中k为用户的兴趣点个数，intersti为用户第i个兴趣点的权重。可以简单的将权重认为是该兴趣点下所包含的标签频率数量。
技术实现思路
在用户某一兴趣类别下，也同样存在着不同的兴趣特征，为了更好的为用...
一种基于用户标签算法

【技术保护点】
1.一种基于用户标签算法，其特征在于，包括如下步骤：(1)根据用户信息，来获取相应的数据，如用户的UID、用户的真实姓名或昵称、用户标签、性别、用户粉丝数、关注数、留言数、创建时间和用户的基本属性；(2)采用数据处理工具Python对数据进行抽取的关注用户的人数、用户的粉丝数量和发布的留言为标准；(3)对用户数据进行特征分析，如留言的数量小于20条、数丝数量不超过20小，称为不活跃用户，将这些不活跃用户过滤掉；(4)最后，根据用户关注者代表了用户的特征和兴趣，只要抽取用户关注者的标签作为原始标签，根据其发表的留言，可以提取出潜在的标签，作为补充添加到候选标签中，最后对频率较高的标签进行筛选，将频率较高的结果推荐给用户。

【技术特征摘要】
1.一种基于用户标签算法，其特征在于，包括如下步骤：(1)根据用户信息，来获取相应的数据，如用户的UID、用户的真实姓名或昵称、用户标签、性别、用户粉丝数、关注数、留言数、创建时间和用户的基本属性；(2)采用数据处理工具Python对数据进行抽取的关注用户的人数、用户的粉丝数量和发布的留言为标准；(3)对用户数据进行特征分析，如留言的数量小于20条、数丝数量不超过20小，称为不活跃用户，将这些不活跃用户过滤掉；(4)最后，根据用...

【专利技术属性】
技术研发人员：万迅，
申请(专利权)人：爱品克科技武汉股份有限公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人