【技术实现步骤摘要】
基于强弱关系网络的用户智能识别方法和系统
[0001]本专利技术涉及人工智能领域,具体地,涉及基于强弱关系网络的用户智能识别方法和系统。
技术介绍
[0002]在互联网时代,现实世界中的同一个用户可能会通过各种不同的设备,使用不同的系统端进行相关业务应用,这样会导致同一个用户的多个信息之间的数据隔离,不利于对该用户的分析与建模,导致无法充分应用该用户的数据价值来优化其用户体验。
[0003]在现有技术中,采用了基于图数据库实时存储及更新的方法来进行用户标识,将待处理用户ID数据映射为图数据库中的子图;将ID关系看作图的无向边,生成用户ID关系图的一个个连通分支子图,每个连通子图代表一个真正的用户,每个连通子图上的标识ID都是同一用户的等价、不同标识ID。
[0004]但是,相关技术大多数只涉及用户标识ID,且每种ID关系权重相同,直接进行了基于图结构的ID关系子图遍历查询。其中的用户关联关系并无强弱权重之分,同时也存在部分用户ID失效及异常的问题。显然,这样会降低其准确性及广泛性。而在真实应用场景中对用户关联识别的容错率很低,高准确性才是关键。因此,为了更加完整的进行用户分析,高效准确的用户数据关联打通成为当前领域优先需要解决的技术难点问题。
[0005]近年来,图计算与人工智能技术的快速发展与成熟应用使得用户精准识别成为了可能,通过这些前沿技术的应用与改进,可以进行基于强弱关系网络的用户识别,提高用户关联映射的准确性,有效解决用户数据打通的难题。
[0006]专利文献CN108491 ...
【技术保护点】
【技术特征摘要】
1.一种基于强弱关系网络的用户智能识别方法,其特征在于,包括:步骤S1:对采集的各个业务端用户埋点数据进行处理,抽取得到用户节点与关系,生成图结构中的顶点结合、边集合;步骤S2:根据所述顶点结合、边集合,得到带有用户节点关系权重的节点关系;步骤S3:根据所述带有用户节点关系权重的节点关系,得到最大连通子图,作为用户识别结果候选集;步骤S4:针对所述用户识别结果候选集,训练得到融合头像昵称的用户识别模型,利用所述融合头像昵称的用户识别模型进行预测,得到最终用户识别结果集。2.根据权利要求1所述的基于强弱关系网络的用户智能识别方法,其特征在于,所述步骤2包括:步骤S2.1:遍历读取每一对节点关系<V
x
,V
y
>;V
x
、V
y
分别是节点对中的两个节点;步骤S2.2:获取每一对节点的相关属性参数{<V
x
,V
y
>:property1,property2,property3,...};property
i
表示第i个属性;步骤S2.3:计算每一对节点的关系权重weight
xy
,计算公式如下:weight
xy
=∑property
i
×
factor
i
其中factor
i
为第i个属性的重要因子,最终每一对节点关系保存为三元组形式<V
x
,weight
xy
,V
y
>。3.根据权利要求2所述的基于强弱关系网络的用户智能识别方法,其特征在于,所述步骤S3包括:步骤S3.1:将所有带有用户节点关系权重的节点关系生成为带权重的图模型;步骤S3.2:针对所述图模型进行最大连通子图计算;所述步骤S3.2包括:步骤S3.2.1:访问当前顶点V1,依次遍历与其直接相关联的第一层顶点V1,V2,V3,...,分别计算W=weight
1i
×
∈
i
,其中∈
i
为对应于weight
1i
的动态衰减因子;weight
1i
表示顶点V1与第i个顶点所构成的一对节点的关系权重;步骤S3.2.2:设定μ为阈值,计算公式如下:其中,N为图模型中的所有节点个数;步骤S3.2.3:如果W≥μ,则该节点V1加入队列Queue中,同时加入最大连通子图结果集中,如果W<μ,则丢弃该节点V1;将下一个顶点作为当前顶点,返回触发步骤S3.2.1;循环触发步骤S3.2.1、步骤S3.2.2、步骤S3.2.3执行,依次遍历每一层节点得到最大连通子图,即用户识别结果候选集。4.根据权利要求3所述的基于强弱关系网络的用户智能识别方法,其特征在于,所述步骤S4包括:步骤S4.1:针对所述用户识别结果候选集,随机选择部分数据作为模型训练样本,获取模型训练样本所包含用户的头像数据、昵称数据;分别计算用户之间头像、昵称的相似度及完全匹配值;
所述步骤4.1包括:步骤S4.1.1:将所述模型训练样本中的用户头像数据进行改变分辨率、旋转操作分别得到操作后的用户头像数据profile1,profile2,并设定操作后的用户头像数据对应的用户昵称分别为name1,name2,作为模型输入数据;步骤S4.1.2:进行头像相似度计算,头像相似度计算采用ResNet+对比学习的方法来进行计算,在整个识别模型训练过程中,头像相似度计算会冻结ResNet50网络的前40层网络,不断优化调整后面网络层的参数,最终将头像图片编码为2048维的向量,通过余弦相似度来计算相似度值;昵称则采用基于规则的完全匹配方式进行相似度计算;步骤S4.2:将所述相似度特征值作为GDBT算法层的输入数据来预测识别用户候选集中的两个可能为同一用户的用户标识是否为同一个用户,得到训练好的融合头像昵称的用户识别模型;其中,所述相似度特征值包括头像相似度特征值、昵称相似度特征值;步骤S4.3:通过训练好的融合头像昵称的用户识别模型进行预测,若出现预测结果冲突,则将出现预测结果冲突的两个用户标记作为识别异常用户,加入到识别异常用户集,否则加入最终用户识别结果集;其中,所述预测结果冲突是指用户候选集中的两个可能为同一用户的用户标识被识别为不是同一用户;步骤S4.4:对识别异常用户集进行人工审核,修正识别错误的用户,并加入用户识别结果集及训练集,不断优化迭代预测模型。5.根据权利要求1所述的基于强弱关系网络的用户智能识别方法,其特征在于,根据在用户关系网络中进行基于强弱关系子图计算,分析用户关系的关联;在图计算过程中,加入节点关系的动态衰减因子,识别排除用户关系图中部分用户数据失效过期或异常情况;其中,用户的ID之间为异质性ID。6.一种基于强弱...
【专利技术属性】
技术研发人员:张福明,王晓霞,李畅,於伟,
申请(专利权)人:上海九方云智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。