The embodiment of the present application relates to the field of Internet technology, in particular to a method and system for determining user labels, which is used to solve the problem of low efficiency in the current method for determining user labels in the prior art. The embodiment of the present application determines the probability of a tag corresponding to a non-seed user in the similarity user set according to the similarity between users in the similarity user set and the tag corresponding to a seed user in the similarity user set, and corresponds the tag corresponding to a probability greater than the probability threshold as a non-seed user. The target tag. Because the probability of identifying the tag corresponding to the non-seed user is determined according to the similarity between users, and the target tag corresponding to the non-seed user is selected according to the determined probability, it does not need to collect a large amount of data training model, thus improving the efficiency of identifying the user tag.
【技术实现步骤摘要】
一种确定用户标签和推送信息的方法及系统
本申请涉及互联网
,特别涉及一种确定用户标签和推送信息的方法及系统。
技术介绍
随着互联网,尤其是电商的快速发展,越来越多的人已经习惯通过互联网浏览新闻、看电影、购物等。目前互联网平台、互联网商家等都会根据需求向用户推送一些信息。比如互联网商家会向用户推送广告。向用户推送信息的方式主要分为定向和非定向两种。非定向是在网页等位置增加需要推送的信息,只要用户登录到该网页就向用户显示预先设置的信息。定向是根据用户的网络行为确定用户的标签,针对不同标签的用户推送不同的信息。对于定向的方式一般采用基于用户分类模型的方法实现。基于用户分类模型的方法是对各网站进行人工标签,在人工标注的基础上对用户采样,作为训练人群,将用户访问数据抽取特征,训练一个多分类模型;利用多分类模型,根据用户访问的数据,给用户添加标签。这种方式需要用到用户分类模型和多分类模型两种模型,而要训练这两种模型需要花费大量时间,并采集大量数据,造成确定用户标签的效率比较低。
技术实现思路
本申请提供一种确定用户标签和推送信息的方法及系统,用以解决现有技术中存在的目前确定用户标签的方式的效率比较低的问题。本申请实施例提供的一种确定用户标签的方法,该方法包括:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。本申请实施例提供的一种 ...
【技术保护点】
1.一种确定用户标签的方法,其特征在于,该方法包括:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。
【技术特征摘要】
1.一种确定用户标签的方法,其特征在于,该方法包括:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。2.如权利要求1所述的方法,其特征在于,所述相似度用户集合中任意一个用户与相似度用户集合中的至少一个用户的相似度满足相似度条件。3.如权利要求1所述的方法,其特征在于,所述根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率,包括:根据所述相似度用户集合中用户之间的相似度确定用户相似度矩阵,以及根据所述种子用户对应的标签确定种子用户标签矩阵;根据所述用户相似度矩阵确定概率转移矩阵,以及根据所述种子用户标签矩阵确定待处理的标签概率矩阵;根据概率转移矩阵对所述待处理的标签概率矩阵进行标签传播处理,得到标签概率矩阵;根据所述标签概率矩阵,确定所述相似度用户集合中非种子用户对应的标签的概率。4.如权利要求3所述的方法,其特征在于,所述根据概率转移矩阵对所述待处理的标签概率矩阵进行标签传播处理,得到标签概率矩阵之后,根据所述标签概率矩阵,确定所述目标用户对应的标签的概率之前,还包括:确定满足标签传播处理结束条件。5.如权利要求4所述的方法,其特征在于,所述根据概率转移矩阵对所述待处理的标签概率矩阵进行标签传播处理,得到标签概率矩阵之后,还包括:若不满足标签传播处理结束条件,则重置种子用户标签矩阵,并返回根据所述种子用户标签矩阵确定待处理的标签概率矩阵的步骤。6.如权利要求4或5所述的方法,其特征在于,所述标签传播处理结束条件为下列中的部分或全部:进行标签传播处理的次数等于迭代次数;最近一次得到的标签概率矩阵收敛。7.一种确定用户标签的系统,其特征在于,该系统包括:集合确定模块,用于确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;处理模块,用于根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;标签确定模块,用于将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。8.如权利要求7所述的系统,其特征在于,所述相似度用户集合中任意一个用户与相似度用户集合中的至少一个用户的相似度满足相似度条件。9.如权利要求7所述的系统,...
【专利技术属性】
技术研发人员:沈珑斌,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。