System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及标签数据处理领域,具体地,涉及一种用于确定标签变更情况及用户标签的方法、处理器及存储介质。
技术介绍
1、用户标签是用来定位用户,了解用户构成,确定用户画像的重要组成部分,确定用户的标签可以完善用户画像以便对用户进行管理。目前在确定用户标签时,只要新增了标签或者修改了标签,就要对全量用户数据进行遍历计算,以对用户打标签,然而用户数据可能几十万,上百万,每一次发生标签变更都需要对全部用户数据进行遍历,则存在大量计算资源和io资源的浪费。
技术实现思路
1、本申请的目的是提供一种节省计算资源的用于确定标签变更情况及用户标签的方法、处理器及存储介质。
2、为了实现上述目的,本申请提供了一种用于确定标签变更情况的方法,方法包括:
3、按照预设时长设置时间窗口的长度;
4、获取时间窗口内标签的变更情况,其中,标签的变更情况包括新增、删减以及修改中至少一者;
5、在任意一个标签发生修改的情况下,确定新标签的新增次数增一,且旧标签的删减次数增一;
6、将每个标签发生的新增次数和删减次数分别进行叠加处理;
7、针对任意一个选定的标签,在标签发生的新增次数与删减次数之间的差值大于零的情况下,确定时间窗口内包括选定的标签;
8、将时间窗口内包括的选定标签确定为时间窗口内的标签集合。
9、在本申请实施例中,方法还包括:在将时间窗口内包括的选定标签确定为时间窗口内的标签集合之后,将标签集合内包括的选定
10、本申请第二方面提供了一种处理器,被配置成执行上述的用于确定标签变更情况的方法。
11、本申请第三方面提供了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得处理器被配置成上述的用于确定标签变更情况的方法。
12、本申请第四方面提供了一种用于确定用户标签的方法,方法包括:
13、获取待分析的多个用户的用户数据和第一待分析标签;
14、设置一个数据窗口,数据窗口包括全部用户的用户数据;
15、根据第一待分析标签对数据窗口内的数据进行分析;
16、在分析过程中至少新增一个第二待分析标签的情况下,确定每个第二待分析标签新增时数据窗口内已经完成分析的数据所在的数据位置;
17、针对任意一个第二待分析标签,根据第一待分析标签、在该第二待分析标签之前新增的标签以及第二待分析标签对第二待分析标签对应的数据位置之后的第一数据进行分析,将第一数据符合的标签确定为第一数据对应的用户的标签;
18、针对任意一个第二待分析标签,在对第一数据进行分析的情况下,同时根据第二待分析标签对数据位置之前的第二数据进行分析,将第二数据符合的标签确定第二数据对应的用户的标签。
19、在本申请实施例中,将第一数据符合的标签确定第一数据对应的用户的标签包括:将第一待分析标签、在该第二待分析标签之前新增的标签以及第二待分析标签均确定为目标待分析标签;针对每个第一数据,根据每个目标待分析标签对第一数据进行分析,针对任意一个目标待分析标签,在第一数据符合目标待分析标签对应的条件的情况下,确定第一数据对应的用户的标签为目标待分析标签;将第二数据符合的标签确定第二数据对应的用户的标签包括:针对每个第二数据,在第二数据符合第二待分析标签对应的条件的情况下,确定第二数据对应的用户的标签为第二待分析标签。
20、本申请第五方面提供了一种处理器,被配置成执行上述的用于确定用户标签的方法。
21、本申请第六方面提供了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得处理器被配置成上述的用于确定用户标签的方法。
22、本申请第七方面提供了一种用于确定用户标签的方法,方法包括:
23、获取待分析的多个用户的用户数据;
24、设置一个数据窗口,数据窗口包括全部用户的用户数据;
25、按照预设时长设置时间窗口的长度;
26、获取当前时间窗口内所有标签的变更情况,其中,标签变更情况包括新增、删减以及修改中至少一者;
27、根据所有标签变更情况确定当前时间窗口内的第一标签集合;
28、每间隔预设时长滑动时间窗口,以确定每次滑动后的时间窗口内的第二标签集合;
29、根据第一标签集合内包括的标签对数据窗口内的用户数据进行分析;
30、在分析过程中至少新增一个第二标签集合的情况下,确定每个第二标签集合新增时数据窗口内已经完成分析的用户数据所在的数据位置;
31、针对任意一个第二标签集合,根据第一标签集合、在第二标签集合之前新增的标签集合以及第二标签集合对第二标签集合对应的数据位置之后的第三数据进行分析,将第三数据符合的标签确定为第三数据对应的用户的标签;
32、针对任意一个第二标签集合,在对第三数据进行分析的情况下,同时根据第二标签集合对数据位置之前的第四数据进行分析,将第四数据符合的标签确定为第四数据对应的用户的标签。
33、在本申请实施例中,根据所有标签变更情况确定当前时间窗口内的第一标签集合包括:在任意一个标签发生修改的情况下,确定新标签的新增次数增一,且旧标签的删减次数增一;将每个标签发生的新增次数和删减次数分别进行叠加处理;针对任意一个选定的标签,在标签发生的新增次数与删减次数之间的差值大于零的情况下,确定当前时间窗口内包括选定的标签;将当前时间窗口内包括的选定标签确定为当前时间窗口内的第一标签集合。
34、在本申请实施例中,将第三数据符合的标签确定为第三数据对应的用户的标签包括:确定第一标签集合、在第二标签集合之前新增的标签集合以及第二标签集合内包括的全部第一标签;针对每个第三数据,根据全部第一标签对第三数据进行分析,针对任意一个第一标签,在第三数据符合第一标签对应的条件的情况下,确定第三数据对应的用户的标签为第一标签。
35、在本申请实施例中,将第四数据符合的标签确定为第四数据对应的用户的标签包括:确定第二标签集合内包括的全部第二标签;针对每个第四数据,根据全部第二标签对第四数据进行分析,针对任意一个第二标签,在第四数据符合第二标签对应的条件的情况下,确定第四数据对应的用户的标签为第二标签。
36、本申请第八方面提供了一种处理器,被配置成执行上述的用于确定用户标签的方法。
37、本申请第九方面提供了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得处理器被配置成上述的用于确定用户标签的方法。
38、通过上述技术方案,通过设置时间窗口对时间窗口内的标签进行计本文档来自技高网...
【技术保护点】
1.一种用于确定标签变更情况的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用于确定标签变更情况的方法,其特征在于,所述方法还包括:
3.一种用于确定用户标签的方法,其特征在于,所述方法包括:
4.根据权利要求3所述的用于确定用户标签的方法,其特征在于,所述将所述第一数据符合的标签确定所述第一数据对应的用户的标签包括:
5.一种用于确定用户标签的方法,其特征在于,所述方法包括:
6.根据权利要求5所述的用于确定用户标签的方法,其特征在于,所述根据所有标签变更情况确定所述当前时间窗口内的第一标签集合包括:
7.根据权利要求5所述的用于确定用户标签的方法,其特征在于,所述将所述第三数据符合的标签确定为所述第三数据对应的用户的标签包括:
8.根据权利要求5所述的用于确定用户标签的方法,其特征在于,所述将所述第四数据符合的标签确定为所述第四数据对应的用户的标签包括:
9.一种处理器,其特征在于,被配置成执行根据权利要求1或2所述的用于确定标签变更情况的方法。
10.一种
11.一种处理器,其特征在于,被配置成执行根据权利要求5至8中任意一项所述的用于确定用户标签的方法。
12.一种机器可读存储介质,该机器可读存储介质上存储有指令,其特征在于,该指令在被处理器执行时使得所述处理器被配置成执行根据权利要求1或2所述的用于确定标签变更情况的方法。
13.一种机器可读存储介质,该机器可读存储介质上存储有指令,其特征在于,该指令在被处理器执行时使得所述处理器被配置成执行根据权利要求3或4所述的用于确定用户标签的方法。
14.一种机器存储介质,该机器可读存储介质上存储有指令,其特征在于,该指令在被处理器执行时使得所述处理器被配置成执行根据权利要求5至8中任意一项所述的用于确定用户标签的方法。
...【技术特征摘要】
1.一种用于确定标签变更情况的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用于确定标签变更情况的方法,其特征在于,所述方法还包括:
3.一种用于确定用户标签的方法,其特征在于,所述方法包括:
4.根据权利要求3所述的用于确定用户标签的方法,其特征在于,所述将所述第一数据符合的标签确定所述第一数据对应的用户的标签包括:
5.一种用于确定用户标签的方法,其特征在于,所述方法包括:
6.根据权利要求5所述的用于确定用户标签的方法,其特征在于,所述根据所有标签变更情况确定所述当前时间窗口内的第一标签集合包括:
7.根据权利要求5所述的用于确定用户标签的方法,其特征在于,所述将所述第三数据符合的标签确定为所述第三数据对应的用户的标签包括:
8.根据权利要求5所述的用于确定用户标签的方法,其特征在于,所述将所述第四数据符合的标签确定为所述第四数据对应的用户的标签包括:
...【专利技术属性】
技术研发人员:贺庆江,凌敬君,王晶,余鑫,熊赳,
申请(专利权)人:中科云谷科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。