【技术实现步骤摘要】
用户身份识别方法及装置
本公开涉及数据挖掘
,具体涉及一种用户身份识别方法、装置、电子设备及存储介质。
技术介绍
随着大数据和人工智能技术的发展,尤其是认知智能技术在近年来的突破,基于关系型数据库的知识图谱技术已经可以在很多应用领域中为用户提供更为专业更加精准的智能分析服务。典型地,利用知识图谱可以为多种基于关系来识别信息的人工智能模型提供支持,比如个性化推荐、关联信息搜索、地图数据处理、社交网络服务、专业知识库、用户身份验证或互联网金融等应用中均可利用知识图谱来进行优化。其中,在基于知识图谱的人工智能模型中,利用知识图谱构建的关系图,应用标签传播算法(LabelPropagationAlgorithm,LPA)能够将种子数据(白名单、黑名单)进行标签传播,进而得到整个网络的概率/置信度情况。对于用户身份/可靠性识别这一应用来说,用户组织/社团的识别有特殊的现实意义,除常规的用户社交、组织关系识别外,作为反欺诈识别中的一项具体任务,欺诈团伙识别是一项必要但难度较大的工作。在一种常见的方法中,首先使用标签传播算法 ...
【技术保护点】
1.一种用户身份识别方法,其特征在于,包括:/n对整体知识图谱进行初次识别,得到至少一个高风险用户社团的第一数据集,分别建立所述用户社团的子图谱;/n获取所述子图谱中各节点的第二数据集,更新所述子图谱;/n根据更新后的所述子图谱构建所述用户社团内部的传播矩阵,基于所述传播矩阵进行二次识别,更新所述子图谱中各个节点的用户风险置信度。/n
【技术特征摘要】
1.一种用户身份识别方法,其特征在于,包括:
对整体知识图谱进行初次识别,得到至少一个高风险用户社团的第一数据集,分别建立所述用户社团的子图谱;
获取所述子图谱中各节点的第二数据集,更新所述子图谱;
根据更新后的所述子图谱构建所述用户社团内部的传播矩阵,基于所述传播矩阵进行二次识别,更新所述子图谱中各个节点的用户风险置信度。
2.根据权利要求1所述的方法,其特征在于,所述初次识别包括:
使用标签传播算法将节点具有的表现值通过传播矩阵传播给关联节点;
在标签传播算法收敛后,使用社区发现算法识别出至少一个用户社团;
对每个用户社团的风险置信度进行识别,确定社团及用户的风险程度。
3.根据权利要求1所述的方法,其特征在于,所述二次识别包括:
使用标签传播算法将节点具有的表现值通过传播矩阵传播给关联节点;
在标签传播算法收敛后,使用社区发现算法识别真实成员、或者筛选剔除更新前后风险置信度值变化变化较小的节点、又或者对更新后的风险置信度值进行归一化;
对每个用户节点的风险置信度进行识别,确定社团及用户的风险程度。
4.根据权利要求1所述的方法,其特征在于,所述获取所述子图谱中各节点的第二数据集包括以下至少一种:
由图谱中的数据综合计算得到所述第二数据集,或是通过第三方数据源获得所述第二数据集,或是通过人工注入的方式获得所述第二数据集。
5.根据权利要求4所述的方法,其特征在于,所述综合计算包括:
采用潜在关联度计算、声纹数据相似性计算、位置关联度计算、生物特征相似度计算和信息发送频率计算中的至少一种进行计算,发现节点之间新的边或更新已有边的权重值。
6.一种用户身份识别装置,其特征在于,包括:
社团识别模块,用于对整体知识图谱进行初次识别,得到至少一个高风...
【专利技术属性】
技术研发人员:姜瑾,
申请(专利权)人:深圳众赢维融科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。