一种基于统计指标的迭代运算的确定用户标签方法技术

技术编号:17467566 阅读:77 留言:0更新日期:2018-03-15 05:04
本发明专利技术的一种基于统计指标的迭代运算的确定用户标签方法,包括如下步骤:S1:沿目标用户的关注方向,选取若干层用户作为潜在的影响目标用户的群体;S2:预设粉丝数量范围;筛选出粉丝数量符合预设范围的用户作为对目标用户标签存在影响的群体,获取该群体的博文以及标签;S3:计算最外层用户的博文内容对标签的贡献值;S4:预设贡献值阈值;筛选出贡献值大于阈值的标签,设定为内层用户的标签;判断该内层用户是否为目标用户;若否,排除原最外层用户,以该内层用户为最外层用户,并重新进行步骤S3、S4的运算;若是,则得出目标用户标签,并结束运算。本发明专利技术通过多次迭代用户标签重新确认用户标签,使及时更新的用户标签更贴合其喜好。

【技术实现步骤摘要】
一种基于统计指标的迭代运算的确定用户标签方法
本专利技术涉及语言文字信息处理领域,具体涉及一种确定用户标签的方法。
技术介绍
随着互联网进行了web2.0时代,以微博、博客等为主体的社交网络的兴起带来了大量的非正式的文本,截止2015年10月为止,微博的月活跃人数已经达到了2.12亿人,发送的推文数以亿记。微博已经成为中文互联网世界里产生数据最多的平台,如何通过微博的内容给用户“正确”的标签,以使用户获得其感兴趣的信息,是当前的研究重点。在原有方法中,使用用户自定义标签来作为用户的标签存在用户标签不准确问题以及用户爱好转换但没有修改标签的问题,会极大的降低标签的准确性。
技术实现思路
针对上述现有技术不足,本专利技术要解决的技术问题是,提供一种用户标签确定方法,用以及时调整用户标签,以使推荐内容更贴合用户兴趣。为解决上述技术问题,本专利技术采用的技术方案为,一种基于统计指标的迭代运算的确定用户标签方法,包括如下步骤:S1:沿目标用户的关注方向,选取若干层用户作为潜在的影响目标用户的群体;S2:预设粉丝数量范围;筛选出潜在的影响目标用户的群体中粉丝数量符合预设范围的用户作为对目标用户标签存本文档来自技高网...
一种基于统计指标的迭代运算的确定用户标签方法

【技术保护点】
一种基于统计指标的迭代运算的确定用户标签方法,其特征在于,包括如下步骤:S1:沿目标用户的关注方向,选取若干层用户作为潜在的影响目标用户的群体;S2:预设粉丝数量范围;筛选出潜在的影响目标用户的群体中粉丝数量符合预设范围的用户作为对目标用户标签存在影响的群体,获取该群体的博文以及标签;S3:计算最外层用户的博文内容对标签的贡献值;S4:预设贡献值阈值;筛选出贡献值大于阈值的标签,设定为内层用户的标签;判断该内层用户是否为目标用户;若不是,排除原最外层用户,以该内层用户为最外层用户,并重新进行步骤S3、S4的运算;若是,则得出目标用户标签,并结束运算。

【技术特征摘要】
1.一种基于统计指标的迭代运算的确定用户标签方法,其特征在于,包括如下步骤:S1:沿目标用户的关注方向,选取若干层用户作为潜在的影响目标用户的群体;S2:预设粉丝数量范围;筛选出潜在的影响目标用户的群体中粉丝数量符合预设范围的用户作为对目标用户标签存在影响的群体,获取该群体的博文以及标签;S3:计算最外层用户的博文内容对标签的贡献值;S4:预设贡献值阈值;筛选出贡献值大于阈值的标签,设定为内层用户的标签;判断该内层用户是否为目标用户;若不是,排除原最外层用户,以该内层用户为最外层用户,并重新进行步骤S3、S4的运算;若是,则得出目标用户标签,并结束运算。2.根据权利要求1所述的基于统计指标的用户标签确定方法,其特征在于,所述步骤S3中,计算贡献值的公式为:

【专利技术属性】
技术研发人员:牟昊杨飞
申请(专利权)人:广州数说故事信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1