确定目标对象的方法及标识关联图的构建方法、装置制造方法及图纸

技术编号:33926253 阅读:18 留言:0更新日期:2022-06-25 21:46
本公开提供了一种确定目标对象的方法及标识关联图的构建方法、装置,可以应用于大数据技术领域,该确定目标对象的方法包括:获取标识关联图,其中,标识关联图包括顶点和边,顶点包括第一类型标识、第二类型标识、编码数据;边用于表征不同顶点之间的已知可信度关系,已知可信度关系用于表征通过顶点确定用户身份的概率,每条宽表数据包括来自同一条业务线的用户标识;确定标识关联图中未与编码数据建立可信度关系的一个或多个第一候选顶点;根据编码数据与第一候选顶点之间的多条目标边对应的已知可信度,计算第一候选顶点的可信度;在第一候选顶点的可信度满足第一预设条件的情况下,将第一候选顶点对应的第二类型标识确定为目标对象。为目标对象。为目标对象。

【技术实现步骤摘要】
确定目标对象的方法及标识关联图的构建方法、装置


[0001]本公开涉及大数据
,更具体地,涉及一种确定目标对象的方法及标识关联图的构建方法、装置、电子设备、计算机存储介质和程序产品。

技术介绍

[0002]随着互联网技术的发展,用户可以使用各种移动设备进行商品网页的浏览,比如:手机、平板电脑、台式电脑等等。在互联网平台向用户进行商品推荐或发放优惠券时,需要识别出哪些移动设备是该用户的常用设备,并将该常用设备作为目标设备,向该用户进行商品推荐或发放优惠券。
[0003]但是,在实现本公开的过程中发现,相关技术中识别用户的常用设备准确率不高,因此,如何较为准确地识别出用户的常用设备是亟待解决的问题。

技术实现思路

[0004]有鉴于此,本公开提供了一种确定目标对象的方法及标识关联图的构建方法、装置、电子设备、计算机存储介质和程序产品。
[0005]本公开的第一方面提供了一种确定目标对象方法,包括:
[0006]获取标识关联图,其中,标识关联图包括顶点和边,顶点包括第一类型标识、第二类型标识、编码数据;边用于表征不同顶点之间的已知可信度关系,已知可信度关系用于表征通过顶点确定用户身份的概率,第一类型标识和第二类型标识均包括表征用户信息的标识,第一类型标识被不同用户共同使用的概率低于第二类型标识被不同用户共同使用的概率,编码数据用于表征每条宽表数据的编码标识,每条宽表数据包括来自同一条业务线的用户标识;
[0007]确定标识关联图中未与编码数据建立可信度关系的一个或多个第一候选顶点;
[0008]根据编码数据与第一候选顶点之间的多条目标边对应的已知可信度,计算第一候选顶点的可信度;
[0009]在第一候选顶点的可信度满足第一预设条件的情况下,将第一候选顶点对应的第二类型标识确定为目标对象。
[0010]根据本公开的实施例,第一类型标识包括用户身份信息标识;第二类型标识包括以下至少之一:用户设备信息标识、用户地址信息标识。
[0011]根据本公开的实施例,根据编码数据与第一候选顶点之间的多条目标边对应的已知可信度,计算第一候选顶点的可信度,包括:
[0012]基于标识关联图,以编码数据为起点,以候选点为终点,将在标识关联图中从起点到终点之间的多条边确定为目标边;
[0013]根据每一条目标边的可信度,确定每一条目标边的权重值;
[0014]根据每一条目标边的权重值,确定第一候选顶点的可信度。
[0015]根据本公开的实施例,上述方法还包括:
[0016]获取多个用户设备信息标识的活跃度,其中,用户设备信息标识的活跃度用于表征在预设时间内设备被用户使用的频率;
[0017]在用户设备信息标识的活跃度满足第二预设条件的情况下,将用户设备信息标识确定为目标对象。
[0018]根据本公开的实施例,上述方法还包括:
[0019]获取多个用户身份信息标识的活跃度,其中,用户身份信息标识的活跃度用于表征在预设时间内身份信息被用户使用的频率;
[0020]在用户身份信息标识的活跃度满足第三预设条件的情况下,将用户身份信息标识的活跃度确定为编码数据的活跃度;
[0021]确定标识关联图中与编码数据建立可信度关系的一个或多个第二候选顶点;
[0022]根据编码数据的活跃度确定一个或多个第二候选顶点的活跃度;
[0023]在第二候选顶点的可信度和活跃度满足第四预设条件的情况下,将第二候选顶点对应的第二类型标识确定所述目标对象。
[0024]根据本公开的实施例,在第二候选顶点与多个编码数据存在已知可信度关系的情况下,根据编码数据的活跃度确定一个或多个第二候选顶点的活跃度,包括:
[0025]确定每一个编码数据的可信度;
[0026]在编码数据的可信度满足第五预设条件的情况下,将编码数据确定为目标编码数据;
[0027]根据目标编码数据的活跃度确定一个或多个第二候选顶点的活跃度。
[0028]根据本公开的实施例,确定每一个编码数据的可信度,包括:
[0029]针对每一个编码数据,根据编码数据对应的宽表数据中的一个或多个用户标识,和一个或多个用户标识的预设权重值,确定编码数据的可信度。
[0030]本公开的第二方面提供了一种标识关联图的构建方法,包括:
[0031]获取来自不同业务线的多条宽表数据,其中,每一条宽表数据包括编码数据、第一类型标识和/或第二类型标识、业务线的可信度,第一类型标识和第二类型标识均包括表征用户信息的标识,第一类型标识被不同用户共同使用的概率低于第二类型标识在预设时间内被不同用户共同使用的概率,编码数据用于表征每条宽表数据的编码标识,每条宽表数据包括来自同一条业务线的用户标识;业务线的可信度用于表征根据业务线中的标识确定用户身份的概率;
[0032]针对每一条宽表数据,以编码数据为第一顶点,将第一顶点依次与同一条宽表数据中的N个标识构建边;
[0033]针对同一条宽表数据中的N个标识,按照预设顺序,以每一个标识为顶点,将第N个标识与第N+1的标识构建边,得到标识关联图,其中,N为大于或等于2的正整数。
[0034]根据本公开的实施例,上述方法还包括:
[0035]根据编码数据和用于执行图计算的设备数量,将所述宽表数据分为M个子宽表数据,其中,M为大于或等于2的正整数,子宽表数据的数量与用于执行图计算的设备数量相同;
[0036]根据M个子宽表数据,构建M个标识子关联图,用于执行图计算。
[0037]本公开的第三方面提供了一种确定目标对象的装置,包括:第一获取模块、第一确
定模块、计算模块和第二确定模块。其中:
[0038]第一获取模块,用于获取标识关联图,其中,标识关联图包括顶点和边,顶点包括第一类型标识、第二类型标识、编码数据;边用于表征不同顶点之间的已知可信度关系,已知可信度关系用于表征通过顶点确定用户身份的概率,第一类型标识和第二类型标识均包括表征用户信息的标识,第一类型标识被不同用户共同使用的概率低于第二类型标识被不同用户共同使用的概率,编码数据用于表征每条宽表数据的编码标识,每条宽表数据包括来自同一条业务线的用户标识。
[0039]第一确定模块,用于确定标识关联图中未与编码数据建立可信度关系的一个或多个候选顶点。
[0040]计算模块,用于根据编码数据与候选顶点之间的多条目标边对应的已知可信度,计算候选顶点的可信度。
[0041]第二确定模块,用于在候选顶点的可信度满足第一预设条件的情况下,将候选顶点对应的第二类型标识确定为目标对象。
[0042]根据本公开的实施例,计算模块包括第一确定单元、第二确定单元和第三确定单元。其中,第一确定单元,用于基于标识关联图,以编码数据为起点,以候选点为终点,将在标识关联图中从起点到终点之间的多条边确定为目标边。第二确定单元,用于根据每一条目标边的可信度,确定每一条目标边的权重值。第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定目标对象的方法,包括:获取标识关联图,其中,所述标识关联图包括顶点和边,所述顶点包括第一类型标识、第二类型标识、编码数据;所述边用于表征不同所述顶点之间的已知可信度关系,所述已知可信度关系用于表征通过所述顶点确定用户身份的概率,所述第一类型标识和所述第二类型标识均包括表征用户信息的标识,所述第一类型标识被不同用户共同使用的概率低于所述第二类型标识被不同用户共同使用的概率,所述编码数据用于表征每条宽表数据的编码标识,每条所述宽表数据包括来自同一条业务线的用户标识;确定所述标识关联图中未与所述编码数据建立可信度关系的一个或多个第一候选顶点;根据所述编码数据与所述第一候选顶点之间的多条目标边对应的已知可信度,计算所述第一候选顶点的可信度;在所述第一候选顶点的可信度满足第一预设条件的情况下,将所述第一候选顶点对应的所述第二类型标识确定为目标对象。2.根据权利要求1所述的方法,其中,所述第一类型标识包括用户身份信息标识;所述第二类型标识包括以下至少之一:用户设备信息标识、用户地址信息标识。3.根据权利要求1或2所述的方法,其中,所述根据所述编码数据与所述第一候选顶点之间的多条目标边对应的已知可信度,计算所述第一候选顶点的可信度,包括:基于所述标识关联图,以所述编码数据为起点,以第一候选顶点为终点,将在所述标识关联图中从所述起点到所述终点之间的多条边确定为所述目标边;根据所述每一条所述目标边的可信度,确定所述每一条所述目标边的权重值;根据所述每一条所述目标边的权重值,确定所述第一候选顶点的可信度。4.根据权利要求2所述的方法,还包括:获取多个用户设备信息标识的活跃度,其中,所述用户设备信息标识的活跃度用于表征在预设时间内设备被用户使用的频率;在所述用户设备信息标识的活跃度满足第二预设条件的情况下,将所述用户设备信息标识确定为所述目标对象。5.根据权利要求2所述的方法,还包括:获取多个用户身份信息标识的活跃度,其中,所述用户身份信息标识的活跃度用于表征在所述预设时间内身份信息被用户使用的频率;在所述用户身份信息标识的活跃度满足第三预设条件的情况下,将所述用户身份信息标识的活跃度确定为所述编码数据的活跃度;确定所述标识关联图中与所述编码数据建立可信度关系的一个或多个第二候选顶点;根据所述编码数据的活跃度确定一个或多个所述第二候选顶点的活跃度;在第二候选顶点的可信度和活跃度满足第四预设条件的情况下,将第二候选顶点对应的第二类型标识确定所述目标对象。6.根据权利要求5所述的方法,在所述候选顶点与多个所述编码数据存在所述已知可信度关系的情况下,所述根据所述编码数据的活跃度确定一个或多个所述第二候选顶点的活跃度,包括:确定每一个所述编码数据的可信度;
在所述编码数据的可信度满足第四预设条件的情况下,将所述编码数据确定为目标编码数据;根据所述目标编码数据的活跃度确定一个或多个所述第二候选顶点的活跃度。7.根据权利要求6所述的方法,其中,所述确定每一个所述编码数据的可信度,包括:针对每一个所述编码数据,根据所述编码数据对应的所述宽表数据中的一个或多个用户标识,和所述一个或多个用户标识的预设权重值,确定所述编码数据的可信度。8.一种标识关联图的构建方法,包括:获取来自不同业务线的多条宽表数据,其中,每一条宽表数据包括编码数据、第一类型标识和/或第二类型标识、业务线的可信度,所述第一类型标识和所述第二类型标识均包括表征用户信息的标识,所述第...

【专利技术属性】
技术研发人员:钱勇
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1