集群识别方法、装置、设备及存储介质制造方法及图纸

技术编号:32652477 阅读:43 留言:0更新日期:2022-03-17 10:58
本申请公开了一种集群识别方法、装置、设备及存储介质,属于互联网和计算机技术领域。所述方法包括:获取待识别集群的成员特征信息;根据待识别集群的成员特征信息和参考集群的成员特征信息,确定待识别集群与参考集群之间的相似度;若相似度满足条件,则确定待识别集群是参考集群的迁移集群。本申请实施例提供的技术方案中,通过在集群网络中获取未知集群,然后从集群成员的角度出发,比较得到已知集群与未知集群之间的相似度,并基于相似度判断两者之间是否存在迁移关系,从而能针对集群的发展和迭代进行跟踪定位,无论集群成员在何种集群名义下进行组织活动,都能掌握集群以及集群成员的动向,提升对集群以及集群成员的跟踪和定位能力。踪和定位能力。踪和定位能力。

【技术实现步骤摘要】
集群识别方法、装置、设备及存储介质


[0001]本申请涉及互联网和计算机
,特别涉及一种集群识别方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,网络上出现了一批黑灰团伙,有组织地进行恶意活动,严重扰乱社会秩序,对社会利益造成重大损害,如何识别出这些黑灰团伙已经成为业界亟待解决的问题。
[0003]相关技术中,通常用矩阵法或图示法来表示社会网络。在图示法中,用图中的节点表示社会中的某一个体,用节点间的连接表示个体间的联系,用连接的大小表示个体间联系的紧密程度,将社会网络中那些具有紧密联系的个体的集合称为社区,通过在社会网络中检测出各个社区,进而从中寻找出异常的黑灰团伙。
[0004]相关技术中,对黑灰团伙的跟踪和定位能力较差。

技术实现思路

[0005]本申请实施例提供了一种集群识别方法、装置、设备及存储介质,能够有效对集群的发展和迭代进行跟踪定位。所述技术方案如下:
[0006]根据本申请实施例的一个方面,提供了一种集群识别方法,所述方法包括:
[0007]获取待识本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种集群识别方法,其特征在于,所述方法包括:获取待识别集群的成员特征信息,所述成员特征信息包括集群中各个成员的特征信息;根据所述待识别集群的成员特征信息和参考集群的成员特征信息,确定所述待识别集群与所述参考集群之间的相似度;若所述相似度满足条件,则确定所述待识别集群是所述参考集群的迁移集群,所述迁移集群是指由所述参考集群中的成员进行迁移产生的集群。2.根据权利要求1所述的方法,其特征在于,所述根据所述待识别集群的成员特征信息和参考集群的成员特征信息,确定所述待识别集群与所述参考集群之间的相似度,包括:根据所述待识别集群的成员特征信息,确定所述待识别集群对应的特征向量;其中,所述特征向量包括集群中各个成员对应的特征值;根据所述参考集群的成员特征信息,确定所述参考集群对应的特征向量;基于所述待识别集群对应的特征向量和所述参考集群对应的特征向量,确定所述待识别集群与所述参考集群之间的相似度。3.根据权利要求2所述的方法,其特征在于,所述基于所述待识别集群对应的特征向量和所述参考集群对应的特征向量,确定所述待识别集群与所述参考集群之间的相似度,包括:将所述待识别集群和所述参考集群中同一成员对应的特征值进行对齐;对于第一成员,在所述待识别集群对应的特征向量中添加所述第一成员对应的特征值,得到所述待识别集群对应的扩展后特征向量;其中,所述第一成员是指所述参考集群中存在但所述待识别集群中不存在的成员;对于第二成员,在所述参考集群对应的特征向量中添加所述第二成员对应的特征值,得到所述参考集群对应的扩展后特征向量;其中,所述第二成员是指所述待识别集群中存在但所述参考集群中不存在的成员;基于所述待识别集群对应的扩展后特征向量和所述参考集群对应的扩展后特征向量,确定所述待识别集群与所述参考集群之间的JS散度;其中,所述JS散度用于度量所述待识别集群与所述参考集群之间的相似度。4.根据权利要求2所述的方法,其特征在于,所述根据所述待识别集群的成员特征信息,确定所述待识别集群对应的特征向量,包括:获取所述待识别集群中各个成员的特征信息;对所述待识别集群中各个成员的特征信息进行归一化处理,得到所述待识别集群对应的特征向量;其中,所述待识别集群对应的特征向量包括:所述待识别集群中各个成员的归一化处理后的特征信息。5.根据权利要求2所述的方法,其特征在于,所述根据所述...

【专利技术属性】
技术研发人员:张杰梁浩强任钢林孙雨豪黄文董井然陈守志
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1