【技术实现步骤摘要】
基于多标记学习的用户标签预测方法、系统及存储介质
本专利技术涉及社交网络领域,尤其是基于多标记学习的用户标签预测方法、系统及存储介质。
技术介绍
当前随着社交网络的出现和快速发展,在国外出现了如Facebook、Twitter和YouTube这样拥有广泛用户的社交网站,国内也出现了类似的,如新浪微博,腾讯微博等新兴社交网络网站。社交网络作为一种传播信息,和朋友联系互动等社交行为的媒介,在日常生活中有非常重要的作用。在社交网络中有一项重要的任务,就是定义社交网络中活动单位——用户的各类标签,比如是用户的兴趣标签、个性标签以及好友关系标签。兴趣标签能反应用户对特定类别信息的关注;个性标签能够反应用户的独特属性,好友关系标签能够反应用户的社交网络。由此可以看出用户标签综合反映了用户在社交网络环境下的个性化特征,借此能广泛的开展兴趣推荐、行为预测、情感分类等任务,帮助服务提供商更好的进行商品推荐、新闻推送以及构建用户画像。此外,随着各种社交网络应用工具的丰富,社交类型也越来越多样化,单个标签已无法满足社交网络中用户日益增长的多元个性 ...
【技术保护点】
1.基于多标记学习的用户标签预测方法,其特征在于:包括以下步骤:/n对原始社交网络用户数据集进行转化,得到描述用户对象的特征数据集和标识用户对象的标签数据集;/n根据用户对象的特征数据集,构建用户对象的特征链;/n对特征链进行编码,获取特征链的表示向量;/n对特征链的表示向量进行解码,生成蕴含用户标签信息的隐藏向量;/n根据隐藏向量,生成实际的用户标签。/n
【技术特征摘要】
1.基于多标记学习的用户标签预测方法,其特征在于:包括以下步骤:
对原始社交网络用户数据集进行转化,得到描述用户对象的特征数据集和标识用户对象的标签数据集;
根据用户对象的特征数据集,构建用户对象的特征链;
对特征链进行编码,获取特征链的表示向量;
对特征链的表示向量进行解码,生成蕴含用户标签信息的隐藏向量;
根据隐藏向量,生成实际的用户标签。
2.根据权利要求1所述的基于多标记学习的用户标签预测方法,其特征在于:所述对原始社交网络用户数据集进行转化,得到描述用户对象的特征数据集和标识用户对象的标签数据集这一步骤,包括以下步骤:
对原始社交网络用户数据集进行初步清洗,得到用户特征数据集;
对用户特征数据集进行归一化处理,得到用户对象的特征向量数据集;
对原始社交网络用户数据集中的用户标签数据集进行过滤,获得用户对象的标签数据集。
3.根据权利要求2所述的基于多标记学习的用户标签预测方法,其特征在于:所述根据用户对象的特征数据集,构建用户对象的特征链这一步骤,包括以下步骤:
基于预设比例,将用户特征数据集拆分为训练特征-标签集、验证特征-标签集和推理测试特征-标签集;
根据训练特征-标签集中的特征数据集构建用户对象的最近邻图;
根据最近邻图获得稀疏矩阵;
根据最近邻图和稀疏矩阵,查询用户对象的最近邻用户对象;
获取每个最近邻用户对象的特征向量集;
根据最近邻用户对象的特征向量集与当前用户对象的特征向量之间的相似程度,构建初步特征链;
把当前用户对象的特征向量插入初步特征链,得到最终的特征链。
4.根据权利要求1所述的基于多标记学习的用户标签预测方法,其特征在于:所述对特征链进行编码,获取特征链的表示向量这一步骤,包括以下步骤:
使用带双向循环的长短期神经网络来对特征链进行编码,从正向和反向分别获得每一时刻的隐藏向量;
将每一时刻的正向隐藏向量和反向隐藏向量进行级联,得到该时刻特征链的表示向量。
5.根据权利要求1所述的基于多标记学习的用户标签预测...
【专利技术属性】
技术研发人员:黄晋,于晗宇,朱佳,
申请(专利权)人:华南师范大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。