一种确定用户标签和推送信息的方法及系统技术方案

技术编号:18668924 阅读:111 留言:0更新日期:2018-08-14 20:48
本申请实施例涉及互联网技术领域,特别涉及一种确定用户标签的方法及系统,用以解决现有技术中存在的目前确定用户标签的方式的效率比较低的问题。本申请实施例根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率,将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。由于根据用户之间的相似度确定非种子用户对应的标签的概率,并根据确定的概率选择非种子用户对应的目标标签,从而不需要采集大量数据训练模型,提高了确定用户标签的效率。

Method and system for determining user label and push information

The embodiment of the present application relates to the field of Internet technology, in particular to a method and system for determining user labels, which is used to solve the problem of low efficiency in the current method for determining user labels in the prior art. The embodiment of the present application determines the probability of a tag corresponding to a non-seed user in the similarity user set according to the similarity between users in the similarity user set and the tag corresponding to a seed user in the similarity user set, and corresponds the tag corresponding to a probability greater than the probability threshold as a non-seed user. The target tag. Because the probability of identifying the tag corresponding to the non-seed user is determined according to the similarity between users, and the target tag corresponding to the non-seed user is selected according to the determined probability, it does not need to collect a large amount of data training model, thus improving the efficiency of identifying the user tag.

【技术实现步骤摘要】
一种确定用户标签和推送信息的方法及系统
本申请涉及互联网
,特别涉及一种确定用户标签和推送信息的方法及系统。
技术介绍
随着互联网,尤其是电商的快速发展,越来越多的人已经习惯通过互联网浏览新闻、看电影、购物等。目前互联网平台、互联网商家等都会根据需求向用户推送一些信息。比如互联网商家会向用户推送广告。向用户推送信息的方式主要分为定向和非定向两种。非定向是在网页等位置增加需要推送的信息,只要用户登录到该网页就向用户显示预先设置的信息。定向是根据用户的网络行为确定用户的标签,针对不同标签的用户推送不同的信息。对于定向的方式一般采用基于用户分类模型的方法实现。基于用户分类模型的方法是对各网站进行人工标签,在人工标注的基础上对用户采样,作为训练人群,将用户访问数据抽取特征,训练一个多分类模型;利用多分类模型,根据用户访问的数据,给用户添加标签。这种方式需要用到用户分类模型和多分类模型两种模型,而要训练这两种模型需要花费大量时间,并采集大量数据,造成确定用户标签的效率比较低。
技术实现思路
本申请提供一种确定用户标签和推送信息的方法及系统,用以解决现有技术中存在的目前确定用户标签的方式的效率比较低的问题。本申请实施例提供的一种确定用户标签的方法,该方法包括:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。本申请实施例提供的一种确定用户标签的系统,该系统包括:集合确定模块,用于确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;处理模块,用于根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;标签确定模块,用于将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。本申请实施例提供的一种推送信息的方法,该方法包括:根据标签和信息的绑定关系,确定需要推送的信息对应的标签;将需要推送的信息推送给确定的所述标签对应的用户;其中,所述用户对应的标签是根据下列方式确定的:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。本申请实施例提供的一种推送信息的系统,该方法包括:标签模块,用于根据标签和信息的绑定关系,确定需要推送的信息对应的标签;推送模块,用于将需要推送的信息推送给确定的所述标签对应的用户;其中,所述用户对应的标签是根据下列方式确定的:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。本申请实施例根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率,将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。由于根据用户之间的相似度确定非种子用户对应的标签的概率,并根据确定的概率选择非种子用户对应的目标标签,从而不需要采集大量数据训练模型,提高了确定用户标签的效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例确定用户标签的方法流程示意图;图2为本申请实施例与所述种子用户关联的目标用户的示意图;图3为本申请实施例标签传播的示意图;图4为本申请实施例确定用户标签的完整方法流程示意图;图5为本申请实施例确定用户标签的系统结构示意图;图6为本申请实施例推送信息的方法流程示意图;图7为本申请实施例推送信息的系统结构示意图。具体实施方式其中,本申请实施例可以应用于任何需要确定用户标签的场景,即人群触达的渠道类场景,比如应用于电商广告、游戏广告、app分发等。本申请实施例的标签可以根据应用场景和需求进行设定,比如应用于电商场景标签可以是商品类别,例如电子产品、婴儿用品等,还可以根据是否购买过卖家商品定义标签为正样本标签和负样本标签。具体标签内容在后面进行详细介绍。为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。如图1所示,本申请实施例确定用户标签的方法包括:步骤100、确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;步骤101、根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;步骤102、将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。本申请实施例根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率,将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。由于根据用户之间的相似度确定非种子用户对应的标签的概率,并根据确定的概率选择非种子用户对应的目标标签,从而不需要采集大量数据训练模型,提高了确定用户标签的效率。本申请实施例可以根据需求方确定对应的种子用户。比如应用于电商场景,确定用户标签是为了向用户推送广告,则需求方就是广告主,需求方对应的种子用户可以是购买过需求方商品的用户。在确定非种子用户对应的目标标签后,就可以向含有需求方对应的标签的非种子用户发送需求方的信息。比如本申请实施例应用于电商场景,需求方的信息为广告,则在含有需求方对应的标签的非种子用户点击含有广告的页面后,可以向非种子用户发送需求方的广告。其中,如果本申请的需求方是广告主,则本申请可以有效地帮助广告主扩展覆盖人群,寻找潜在的客户。本申请实施例需要确定种子用户。不同的需求方对应的种子用户也不相同。比如需求方是广告主,则可以将广告主的客户作为种子人群,在相似用户网络中传播标签,相似用户网络的建立依赖用户对内容的访问数据,内容访问越重叠的用户具有越高的临近关系。以本申请实施例应用于电商场景为例,假设需求方A销售婴儿用品、需求方B销售电子产品,可以将购买过需求方A的商品的用户作为需求方A对应的种子用户,并标记种子用户标签为婴儿用品;将购买过需求方B的商品的用户作为需求方B对应本文档来自技高网...

【技术保护点】
1.一种确定用户标签的方法,其特征在于,该方法包括:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。

【技术特征摘要】
1.一种确定用户标签的方法,其特征在于,该方法包括:确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。2.如权利要求1所述的方法,其特征在于,所述相似度用户集合中任意一个用户与相似度用户集合中的至少一个用户的相似度满足相似度条件。3.如权利要求1所述的方法,其特征在于,所述根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率,包括:根据所述相似度用户集合中用户之间的相似度确定用户相似度矩阵,以及根据所述种子用户对应的标签确定种子用户标签矩阵;根据所述用户相似度矩阵确定概率转移矩阵,以及根据所述种子用户标签矩阵确定待处理的标签概率矩阵;根据概率转移矩阵对所述待处理的标签概率矩阵进行标签传播处理,得到标签概率矩阵;根据所述标签概率矩阵,确定所述相似度用户集合中非种子用户对应的标签的概率。4.如权利要求3所述的方法,其特征在于,所述根据概率转移矩阵对所述待处理的标签概率矩阵进行标签传播处理,得到标签概率矩阵之后,根据所述标签概率矩阵,确定所述目标用户对应的标签的概率之前,还包括:确定满足标签传播处理结束条件。5.如权利要求4所述的方法,其特征在于,所述根据概率转移矩阵对所述待处理的标签概率矩阵进行标签传播处理,得到标签概率矩阵之后,还包括:若不满足标签传播处理结束条件,则重置种子用户标签矩阵,并返回根据所述种子用户标签矩阵确定待处理的标签概率矩阵的步骤。6.如权利要求4或5所述的方法,其特征在于,所述标签传播处理结束条件为下列中的部分或全部:进行标签传播处理的次数等于迭代次数;最近一次得到的标签概率矩阵收敛。7.一种确定用户标签的系统,其特征在于,该系统包括:集合确定模块,用于确定相似度用户集合,其中相似度用户集合中的任意一个用户与相似度用户集合中的至少一个用户关联;处理模块,用于根据所述相似度用户集合中用户之间的相似度,以及所述相似度用户集合中种子用户对应的标签,确定所述相似度用户集合中非种子用户对应的标签的概率;标签确定模块,用于将大于概率阈值的概率对应的标签作为非种子用户对应的目标标签。8.如权利要求7所述的系统,其特征在于,所述相似度用户集合中任意一个用户与相似度用户集合中的至少一个用户的相似度满足相似度条件。9.如权利要求7所述的系统,...

【专利技术属性】
技术研发人员:沈珑斌
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1