基于强弱关系网络的用户智能识别方法和系统技术方案

技术编号:34487833 阅读:12 留言:0更新日期:2022-08-10 09:05
本发明专利技术提供了一种基于强弱关系网络的用户智能识别方法和系统,对采集的各个业务端用户埋点数据进行处理,抽取得到用户节点与关系,生成图结构中的顶点结合、边集合;得到带有用户节点关系权重的节点关系;得到最大连通子图,作为用户识别结果候选集;训练得到融合头像昵称的用户识别模型,利用所述融合头像昵称的用户识别模型进行预测,得到最终用户识别结果集。本发明专利技术通过在用户关系网络中进行基于强弱关系子图计算,解决用户关系的错误性关联问题,并解决了用户关系图中部分用户数据失效过期或异常的问题,避免造成资源浪费及错误关系计算,且加入用户头像昵称相似度计算保证用户识别的准确性、适用性及广泛性。适用性及广泛性。适用性及广泛性。

【技术实现步骤摘要】
基于强弱关系网络的用户智能识别方法和系统


[0001]本专利技术涉及人工智能领域,具体地,涉及基于强弱关系网络的用户智能识别方法和系统。

技术介绍

[0002]在互联网时代,现实世界中的同一个用户可能会通过各种不同的设备,使用不同的系统端进行相关业务应用,这样会导致同一个用户的多个信息之间的数据隔离,不利于对该用户的分析与建模,导致无法充分应用该用户的数据价值来优化其用户体验。
[0003]在现有技术中,采用了基于图数据库实时存储及更新的方法来进行用户标识,将待处理用户ID数据映射为图数据库中的子图;将ID关系看作图的无向边,生成用户ID关系图的一个个连通分支子图,每个连通子图代表一个真正的用户,每个连通子图上的标识ID都是同一用户的等价、不同标识ID。
[0004]但是,相关技术大多数只涉及用户标识ID,且每种ID关系权重相同,直接进行了基于图结构的ID关系子图遍历查询。其中的用户关联关系并无强弱权重之分,同时也存在部分用户ID失效及异常的问题。显然,这样会降低其准确性及广泛性。而在真实应用场景中对用户关联识别的容错率很低,高准确性才是关键。因此,为了更加完整的进行用户分析,高效准确的用户数据关联打通成为当前领域优先需要解决的技术难点问题。
[0005]近年来,图计算与人工智能技术的快速发展与成熟应用使得用户精准识别成为了可能,通过这些前沿技术的应用与改进,可以进行基于强弱关系网络的用户识别,提高用户关联映射的准确性,有效解决用户数据打通的难题。
[0006]专利文献CN108491424A公开了一种用户ID关联方法及装置,用户ID关联方法包括:获取目标对象在预设时段内的用户ID历史日志;基于用户ID历史日志确定不同的用户ID之间的关联特征;根据用户ID历史日志建立用户ID映射关系列表,并依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;若是,则确定该用户ID和对应的其他类型的用户ID之间的置信度为1;否则,则根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
[0007]该专利文献CN108491424A的专利技术构思是获取多个用户ID数据,建立多个用户ID数据之间的关联关系,并判断用户ID数据之间关联的置信度。其设置置信度采用的是仅仅针对两个用户ID映射关系列表中不同关联特征进行关联性分析的方法来获得的,其中的两个ID是同质性的,即同种类型的ID,均为用户ID,其用户ID仅仅是一种用户的身份标识,并没有任何其他实际意义。所以存在时效性低、灵活性弱、关联特征存在失效过期导致置信度无法及时更新,以及没有考虑用户ID网络的异质性的这个缺点。导致ID关联映射无法实时更新、数据利用率低、准确率低甚至无法生效的情况。
[0008]而本专利技术由于是采用基于充分利用用户相关数据,其中包括异质性的ID,即不同类型的ID。将用户ID关系生成为具有强弱关系划分的最大连通子图,增加动态衰减因子,通
过子图计算灵活生成用户映射关系,利用用户头像昵称数据对用户映射关系进行进一步预测,以提高准确率。也就是说,本专利技术通过中的ID是网络中的ID,例如身份证ID、手机号、微信号等,本专利技术通过异质性的ID可以构建直观高效的用户ID网络图结构,可以充分利用丰富多样的用户数据,采用先进的图结构算法,满足用户ID映射的时效性、灵活性、准确性等。其中,图结构中包含的用户ID、身份证ID、手机号、微信号等为异质性ID。可以将异质性ID理解为用户在不同平台上的ID。

技术实现思路

[0009]针对现有技术中的缺陷,本专利技术的目的是提供一种基于强弱关系网络的用户智能识别方法和系统。
[0010]根据本专利技术提供的一种基于强弱关系网络的用户智能识别方法,包括:
[0011]步骤S1:对采集的各个业务端用户埋点数据进行处理,抽取得到用户节点与关系,生成图结构中的顶点结合、边集合;
[0012]步骤S2:根据所述顶点结合、边集合,得到带有用户节点关系权重的节点关系;
[0013]步骤S3:根据所述带有用户节点关系权重的节点关系,得到最大连通子图,作为用户识别结果候选集;
[0014]步骤S4:针对所述用户识别结果候选集,训练得到融合头像昵称的用户识别模型,利用所述融合头像昵称的用户识别模型进行预测,得到最终用户识别结果集。
[0015]优选地,所述步骤2包括:
[0016]步骤S2.1:遍历读取每一对节点关系<V
x
,V
y
>;V
x
、V
y
分别是节点对中的两个节点;
[0017]步骤S2.2:获取每一对节点的相关属性参数
[0018]{<V
x
,V
y
>:property1,property2,property3,...};property
i
表示第i个属性;
[0019]步骤S2.3:计算每一对节点的关系权重weight
xy
,计算公式如下:
[0020]weight
xy
=∑property
i
×
factor
i
[0021]其中factor
i
为第i个属性的重要因子,最终每一对节点关系保存为三元组形式<V
x
,weight
xy
,V
y
>。
[0022]优选地,所述步骤S3包括:
[0023]步骤S3.1:将所有带有用户节点关系权重的节点关系生成为带权重的图模型;
[0024]步骤S3.2:针对所述图模型进行最大连通子图计算;
[0025]所述步骤S3.2包括:
[0026]步骤S3.2.1:访问当前顶点V1,依次遍历与其直接相关联的第一层顶点V1,V2,V3,...,分别计算W=weight
1i
×

i
,其中∈
i
为对应于weight
1i
的动态衰减因子;weight
1i
表示顶点V1与第i个顶点所构成的一对节点的关系权重;
[0027]步骤S3.2.2:设定μ为阈值,计算公式如下:
[0028][0029]其中,N为图模型中的所有节点个数;
[0030]步骤S3.2.3:如果W≥μ,则该节点V1加入队列Queue中,同时加入最大连通子图结
果集中,如果W<μ,则丢弃该节点V1;将下一个顶点作为当前顶点,返回触发步骤S3.2.1;
[0031]循环触发步骤S3.2.1、步骤S3.2.2、步骤S3.2.3执行,依次遍历每一层节点得到最大连通子图,即用户识别结果候选集。
[0032]优选地,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强弱关系网络的用户智能识别方法,其特征在于,包括:步骤S1:对采集的各个业务端用户埋点数据进行处理,抽取得到用户节点与关系,生成图结构中的顶点结合、边集合;步骤S2:根据所述顶点结合、边集合,得到带有用户节点关系权重的节点关系;步骤S3:根据所述带有用户节点关系权重的节点关系,得到最大连通子图,作为用户识别结果候选集;步骤S4:针对所述用户识别结果候选集,训练得到融合头像昵称的用户识别模型,利用所述融合头像昵称的用户识别模型进行预测,得到最终用户识别结果集。2.根据权利要求1所述的基于强弱关系网络的用户智能识别方法,其特征在于,所述步骤2包括:步骤S2.1:遍历读取每一对节点关系<V
x
,V
y
>;V
x
、V
y
分别是节点对中的两个节点;步骤S2.2:获取每一对节点的相关属性参数{<V
x
,V
y
>:property1,property2,property3,...};property
i
表示第i个属性;步骤S2.3:计算每一对节点的关系权重weight
xy
,计算公式如下:weight
xy
=∑property
i
×
factor
i
其中factor
i
为第i个属性的重要因子,最终每一对节点关系保存为三元组形式<V
x
,weight
xy
,V
y
>。3.根据权利要求2所述的基于强弱关系网络的用户智能识别方法,其特征在于,所述步骤S3包括:步骤S3.1:将所有带有用户节点关系权重的节点关系生成为带权重的图模型;步骤S3.2:针对所述图模型进行最大连通子图计算;所述步骤S3.2包括:步骤S3.2.1:访问当前顶点V1,依次遍历与其直接相关联的第一层顶点V1,V2,V3,...,分别计算W=weight
1i
×

i
,其中∈
i
为对应于weight
1i
的动态衰减因子;weight
1i
表示顶点V1与第i个顶点所构成的一对节点的关系权重;步骤S3.2.2:设定μ为阈值,计算公式如下:其中,N为图模型中的所有节点个数;步骤S3.2.3:如果W≥μ,则该节点V1加入队列Queue中,同时加入最大连通子图结果集中,如果W<μ,则丢弃该节点V1;将下一个顶点作为当前顶点,返回触发步骤S3.2.1;循环触发步骤S3.2.1、步骤S3.2.2、步骤S3.2.3执行,依次遍历每一层节点得到最大连通子图,即用户识别结果候选集。4.根据权利要求3所述的基于强弱关系网络的用户智能识别方法,其特征在于,所述步骤S4包括:步骤S4.1:针对所述用户识别结果候选集,随机选择部分数据作为模型训练样本,获取模型训练样本所包含用户的头像数据、昵称数据;分别计算用户之间头像、昵称的相似度及完全匹配值;
所述步骤4.1包括:步骤S4.1.1:将所述模型训练样本中的用户头像数据进行改变分辨率、旋转操作分别得到操作后的用户头像数据profile1,profile2,并设定操作后的用户头像数据对应的用户昵称分别为name1,name2,作为模型输入数据;步骤S4.1.2:进行头像相似度计算,头像相似度计算采用ResNet+对比学习的方法来进行计算,在整个识别模型训练过程中,头像相似度计算会冻结ResNet50网络的前40层网络,不断优化调整后面网络层的参数,最终将头像图片编码为2048维的向量,通过余弦相似度来计算相似度值;昵称则采用基于规则的完全匹配方式进行相似度计算;步骤S4.2:将所述相似度特征值作为GDBT算法层的输入数据来预测识别用户候选集中的两个可能为同一用户的用户标识是否为同一个用户,得到训练好的融合头像昵称的用户识别模型;其中,所述相似度特征值包括头像相似度特征值、昵称相似度特征值;步骤S4.3:通过训练好的融合头像昵称的用户识别模型进行预测,若出现预测结果冲突,则将出现预测结果冲突的两个用户标记作为识别异常用户,加入到识别异常用户集,否则加入最终用户识别结果集;其中,所述预测结果冲突是指用户候选集中的两个可能为同一用户的用户标识被识别为不是同一用户;步骤S4.4:对识别异常用户集进行人工审核,修正识别错误的用户,并加入用户识别结果集及训练集,不断优化迭代预测模型。5.根据权利要求1所述的基于强弱关系网络的用户智能识别方法,其特征在于,根据在用户关系网络中进行基于强弱关系子图计算,分析用户关系的关联;在图计算过程中,加入节点关系的动态衰减因子,识别排除用户关系图中部分用户数据失效过期或异常情况;其中,用户的ID之间为异质性ID。6.一种基于强弱...

【专利技术属性】
技术研发人员:张福明王晓霞李畅於伟
申请(专利权)人:上海九方云智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1