一种身份标识识别方法、装置以及相关设备制造方法及图纸

技术编号:21957011 阅读:41 留言:0更新日期:2019-08-24 20:32
本发明专利技术实施例公开了一种身份标识识别方法、装置以及相关设备,方法包括:获取多个身份标识,根据多个身份标识对应的业务关系数据和多个身份标识对应的业务行为数据,计算每个身份标识分别对应的目标异常分数;目标异常分数表示身份标识属于虚假类型的身份标识的概率;根据目标异常分数从多个身份标识中选取至少一个身份标识,作为样本身份标识,并确定样本身份标识对应的样本标签为虚假身份标签;根据多个身份标识对应的业务行为数据、样本身份标识对应的虚假身份标签,在多个身份标识中识别属于虚假类型的身份标识,作为目标虚假身份标识;目标虚假身份标识包括样本身份标识。采用本发明专利技术,可以提高身份标识识别的效率。

An Identity Identification Method, Device and Related Equipment

【技术实现步骤摘要】
一种身份标识识别方法、装置以及相关设备
本专利技术涉及计算机
,尤其涉及一种身份标识识别方法、装置以及相关设备。
技术介绍
随着社会的发展,社交网已经成为一种重要的交互媒体,正在逐渐改变传统的信息传播方式。任何人在任何时间任何地点都可以在社交网平台上发布信息,其中不乏有经济价值和社会意义的需求信息。与此同时,信息的甄别也变得尤为重要,由于网络的快速发展,社交网络上信息的传播速度极其迅速,因此识别社交网络平台中的虚假用户,阻止其传播虚假信息就变得非常重要。现有识别虚假用户的方式主要分为有监督的识别和无监督的识别,有监督的识别的过程是:通过大量带有标签的训练样本训练分类器,利用分类器识别虚假账号;无监督的识别过程是:通过聚类的方法直接识别多个账号中的虚假账号。基于有监督的识别方法难以获取大量的训练样本且训练分类器的时间花销庞大,基于无监督的识别方法需要很强的专家知识来设定识别过程中的各项参数且还需计算两两账号之间的相似度,就要耗费大量的计算时间。上述可见,无论是有监督的识别虚假账号或者无监督的识别虚假账号,都需要花费大量的计算时间,识别效率低下。
技术实现思路
本专利技术实施例提供一种身份标识识别方法、装置以及相关设备,可以提高识别虚假账号的效率。本专利技术一方面提供了一种身份标识识别方法,包括:获取多个身份标识,根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,计算每个身份标识分别对应的目标异常分数;所述目标异常分数表示身份标识属于虚假类型的身份标识的概率;根据所述目标异常分数从所述多个身份标识中选取至少一个身份标识,作为样本身份标识,并确定所述样本身份标识对应的样本标签为虚假身份标签;根据所述多个身份标识对应的业务行为数据、所述样本身份标识对应的虚假身份标签,在所述多个身份标识中识别属于虚假类型的身份标识,作为目标虚假身份标识;所述目标虚假身份标识包括所述样本身份标识。其中,所述根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,计算每个身份标识分别对应的目标异常分数,包括:根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,在所述多个身份标识中识别属于正常类型的身份标识,作为种子身份标识;根据所述多个身份标识对应的业务关系数据和所述种子身份标识,计算所述每个身份标识分别对应的目标异常分数。其中,所述根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,在所述多个身份标识中识别属于正常类型的身份标识,作为种子身份标识,包括:根据所述多个身份标识对应的业务关系数据,将所述多个身份标识划分为至少一个身份标识社区;根据所述多个身份标识对应的业务行为数据,在每个身份标识社区中识别属于正常类型的身份标识,作为所述种子身份标识。其中,所述根据所述多个身份标识对应的业务关系数据,将所述多个身份标识划分为至少一个身份标识社区,包括:将所述每个身份标识分别确定为初始节点,并将所述每个初始节点分别划分至不同的原始社区;计算处于不同原始社区的初始节点的模块度,作为原始模块度,根据所述多个身份标识对应的业务关系数据和所述原始模块度,调整每个原始社区所覆盖的身份标识,将调整后的原始社区作为参考社区,将处于同一个参考社区中的多个身份标识作为一个初始节点,并将所述参考社区确定为所述原始社区,在所述每个参考社区所覆盖的身份标识满足收敛条件时,将所述每个参考社区分别确定为所述身份标识社区。其中,所述根据所述多个身份标识对应的业务关系数据和所述原始模块度,调整每个原始社区所覆盖的身份标识,将调整后的原始社区作为参考社区,包括:为每个身份标识设置轮询优先级;根据所述轮询优先级从所述多个身份标识中选择用于当前轮询的身份标识,确定为目标待设置身份标识;根据所述多个身份标识对应的业务关系数据,确定与所述目标待设置身份标识相邻的参考身份标识;将所述目标待设置身份标识划分至所述参考身份标识所在的原始社区,并计算划分后的模块度,作为调整模块度;若所述调整模块度大于所述原始模块度,则确定所述目标待设置身份标识属于所述参考身份标识所在的原始社区,并将所述调整模块度确定为所述原始模块度;若所述调整模块度小于所述原始模块度,则保持所述目标待设置身份标识处于所属的原始社区;将所述目标待设置身份标识所在的原始社区,作为所述目标待设置身份标识对应的参考社区;当每个身份标识均被确定为目标待设置身份标识,且所述原始模块度不再增大时,停止轮询。其中,所述根据所述多个身份标识对应的业务行为数据,在每个身份标识社区中识别属于正常类型的身份标识,作为所述种子身份标识,包括:根据所述每个身份标识对应的业务行为数据中的登录行为数据和社交行为数据,计算每个身份标识的信用值;所述信用值表示身份标识属于正常类型的身份标识的概率;根据每个身份标识社区所覆盖的身份标识数量,确定所述每个身份标识社区对应的信用阈值;在所述每个身份标识社区中,将所述信用值大于所述信用阈值的身份标识,作为所述种子身份标识。其中,所述根据所述多个身份标识对应的业务关系数据和所述种子身份标识,计算所述每个身份标识分别对应的目标异常分数,包括:为所述种子身份标识设置第一异常分数,为非种子身份标识设置第二异常分数,并将所述第一异常分数和所述第二异常分数作为初始异常分数;所述非种子身份标识是指所述多个身份标识中除了所述种子身份标识以外的身份标识;若所述多个身份标识的数量小于数量阈值,则根据所述每个身份标识对应的业务关系数据,对每个身份标识的初始异常分数进行调整,得到所述每个身份标识的目标异常分数。其中,所述根据所述每个身份标识对应的业务关系数据,对每个身份标识的初始异常分数进行调整,得到所述每个身份标识的目标异常分数,包括:根据所述每个身份标识的业务关系数据,分别调整每个身份标识的初始异常分数,将调整后的初始异常分数作为辅助异常分数,并将每个身份标识的辅助异常分数确定初始异常分数,进行下一轮的初始异常分数调整,并在每个身份标识的初始异常分数所对应的调整次数均到达所述次数阈值时,将所述每个身份标识的辅助异常分数确定为所述目标异常分数。其中,所述根据所述每个身份标识的业务关系数据,分别调整每个身份标识的初始异常分数,将调整后的初始异常分数作为辅助异常分数,并将每个身份标识的辅助异常分数确定初始异常分数,进行下一轮的初始异常分数调整,并在每个身份标识的初始异常分数所对应的调整次数均到达所述次数阈值时,将所述每个身份标识的辅助异常分数确定为所述目标异常分数,包括:从所述多个身份标识中获取待处理身份标识;根据所述待处理身份标识的业务关系数据,确定与所述待处理身份标识相邻的身份标识,作为辅助身份标识,并确定所述辅助身份标识与所述待处理身份标识之间的连接权重;根据所述辅助身份标识的初始异常分数和所述连接权重,调整所述待处理身份标识的初始异常分数,得到所述待处理身份标识的辅助异常分数;当所有身份标识均被确定为待处理身份标识时,将每个身份标识的辅助异常分数确定为初始异常分数,并进行下一轮的初始异常分数调整,并在每个身份标识的初始异常分数所对应的调整次数均到达所述次数阈值时,将所述每个身份标识的辅助异常分数确定为所述目标异常分数。其中,还包括:本文档来自技高网...

【技术保护点】
1.一种身份标识识别方法,其特征在于,包括:获取多个身份标识,根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,计算每个身份标识分别对应的目标异常分数;所述目标异常分数表示身份标识属于虚假类型的身份标识的概率;根据所述目标异常分数从所述多个身份标识中选取至少一个身份标识,作为样本身份标识,并确定所述样本身份标识对应的样本标签为虚假身份标签;根据所述多个身份标识对应的业务行为数据、所述样本身份标识对应的虚假身份标签,在所述多个身份标识中识别属于虚假类型的身份标识,作为目标虚假身份标识;所述目标虚假身份标识包括所述样本身份标识。

【技术特征摘要】
1.一种身份标识识别方法,其特征在于,包括:获取多个身份标识,根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,计算每个身份标识分别对应的目标异常分数;所述目标异常分数表示身份标识属于虚假类型的身份标识的概率;根据所述目标异常分数从所述多个身份标识中选取至少一个身份标识,作为样本身份标识,并确定所述样本身份标识对应的样本标签为虚假身份标签;根据所述多个身份标识对应的业务行为数据、所述样本身份标识对应的虚假身份标签,在所述多个身份标识中识别属于虚假类型的身份标识,作为目标虚假身份标识;所述目标虚假身份标识包括所述样本身份标识。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,计算每个身份标识分别对应的目标异常分数,包括:根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,在所述多个身份标识中识别属于正常类型的身份标识,作为种子身份标识;根据所述多个身份标识对应的业务关系数据和所述种子身份标识,计算所述每个身份标识分别对应的目标异常分数。3.根据权利要求2所述的方法,其特征在于,所述根据所述多个身份标识对应的业务关系数据和所述多个身份标识对应的业务行为数据,在所述多个身份标识中识别属于正常类型的身份标识,作为种子身份标识,包括:根据所述多个身份标识对应的业务关系数据,将所述多个身份标识划分为至少一个身份标识社区;根据所述多个身份标识对应的业务行为数据,在每个身份标识社区中识别属于正常类型的身份标识,作为所述种子身份标识。4.根据权利要求3所述的方法,其特征在于,所述根据所述多个身份标识对应的业务关系数据,将所述多个身份标识划分为至少一个身份标识社区,包括:将所述每个身份标识分别确定为初始节点,并将所述每个初始节点分别划分至不同的原始社区;计算处于不同原始社区的初始节点的模块度,作为原始模块度,根据所述多个身份标识对应的业务关系数据和所述原始模块度,调整每个原始社区所覆盖的身份标识,将调整后的原始社区作为参考社区,将处于同一个参考社区中的多个身份标识作为一个初始节点,并将所述参考社区确定为所述原始社区,在所述每个参考社区所覆盖的身份标识满足收敛条件时,将所述每个参考社区分别确定为所述身份标识社区。5.根据权利要求4所述的方法,其特征在于,所述根据所述多个身份标识对应的业务关系数据和所述原始模块度,调整每个原始社区所覆盖的身份标识,将调整后的原始社区作为参考社区,包括:为每个身份标识设置轮询优先级;根据所述轮询优先级从所述多个身份标识中选择用于当前轮询的身份标识,确定为目标待设置身份标识;根据所述多个身份标识对应的业务关系数据,确定与所述目标待设置身份标识相邻的参考身份标识;将所述目标待设置身份标识划分至所述参考身份标识所在的原始社区,并计算划分后的模块度,作为调整模块度;若所述调整模块度大于所述原始模块度,则确定所述目标待设置身份标识属于所述参考身份标识所在的原始社区,并将所述调整模块度确定为所述原始模块度;若所述调整模块度小于所述原始模块度,则保持所述目标待设置身份标识处于所属的原始社区;将所述目标待设置身份标识所在的原始社区,作为所述目标待设置身份标识对应的参考社区;当每个身份标识均被确定为目标待设置身份标识,且所述原始模块度不再增大时,停止轮询。6.根据权利要求3所述的方法,其特征在于,所述根据所述多个身份标识对应的业务行为数据,在每个身份标识社区中识别属于正常类型的身份标识,作为所述种子身份标识,包括:根据所述每个身份标识对应的业务行为数据中的登录行为数据和社交行为数据,计算每个身份标识的信用值;所述信用值表示身份标识属于正常类型的身份标识的概率;根据每个身份标识社区所覆盖的身份标识数量,确定所述每个身份标识社区对应的信用阈值;在所述每个身份标识社区中,将所述信用值大于所述信用阈值的身份标识,作为所述种子身份标识。7.根据权利要求2所述的方法,其特征在于,所述根据所述多个身份标识对应的业务关系数据和所述种子身份标识,计算所述每个身份标识分别对应的目标异常分数,包括:为所述种子身份标识设置第一异常分数,为非种子身份标识设置第二异常分数,并将所述第一异常分数和所述第二异常分数作为初始异常分数;所述非种子身份标识是指所述多个身份标识中除了所述种子身份标识以外的身份标识;若所述多个身份标识的数量小于数量阈值,则根据所述每个身份标识对应的业务关系数据,对每个身份标识的初始异常分数进行调整,得到所述每个身份标识的目标异常分数。8.根据权利要求7所述的方法,其特征在于,所述根据所述每个身份标识对应的业务关系数据,对每个身份标识的初始异常分数进行调整,得到所述每个身份标识的目标异常分数,包括:根据所述每个身份标识的业务关系数据,分别调整每个身份标识的初始异常分数,将调整后的初始异常分数作为辅助异常分数,并将每个身份标识的辅助异常分数确定初始异常分数,进行下一轮的初始异常分数调整,并在每个身份标识的初始异常分数所对应的调整次数均到达所述次数阈值时,将所述每个身份标识的辅助异常分数确定为所述目标异常分数。9.根据权利要求8所述的方法,其特征在于,所述根据所述每个身份标识的业务关系数据,分别调整每个身份标识的初始异常分数,将调整后的初始异常分数作为辅助异常分数,并将每个身份标识的辅助异常分数确定初始异常分数,进行下一轮的初始异常分数调整,并在每个身份标识的初始异常分数所对应的调整次数均到达所述次数阈值时,将所述每个身份标识的辅助异常分数确定为所述目标异常分数,包括:从所述多个身...

【专利技术属性】
技术研发人员:齐逸岩成杰峰黄俊深
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1