对未归类用户群进行归类的方法及相关装置制造方法及图纸

技术编号:22022811 阅读:32 留言:0更新日期:2019-09-04 01:28
本公开提供了一种对未归类用户群进行归类的方法及相关装置,所述方法包括:基于已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系、每个用户群的群特征,确定每个用户群的群向量、和将各未归类用户群确定为预定类型的用户群的第一概率,并将各已归类用户群确定为预定类型的用户群的第一概率设为固定值;基于已归类用户群和未归类用户群中的各用户群之间用户之间的好友关系、确定的各用户群的群向量、和将各用户群确定为预定类型的用户群的第一概率,确定将各未归类用户群确定为预定类型的用户群的第二概率;根据未归类用户群的第二概率,将所述未归类用户群归类。本公开实施例能够提高对未归类用户群归类的准确率与召回率。

The Method and Related Devices of Classifying Unclassified User Groups

【技术实现步骤摘要】
对未归类用户群进行归类的方法及相关装置
本公开涉及群归类领域,具体涉及一种对未归类用户群进行归类的方法及相关装置。
技术介绍
随着互联网技术的高度发展,用户在各种网络平台上相互集结为各个用户群,从事着各种各样的活动:例如,社交活动、交易活动。在这个过程中,滋生了各种专门从事非法活动的线上用户群。为了维护社会的安全稳定,要能够准确地对各个线上用户群进行归类,确定其是否为从事非法活动的线上用户群,从而能够采取相应的管理措施。现有技术中基于监督学习对线上用户群归类时,需要投入大量人力,对作为监督学习中样本的线上用户群进行人工分类、标注。通过这种方法对线上用户群进行的归类,准确率低、召回率低。
技术实现思路
本公开的一个目的在于提出一种对未归类用户群进行归类的方法及终端,能够提高对未归类用户群进行归类的准确率以及召回率。根据本公开实施例的一方面,公开了一种对未归类用户群进行归类的方法,所述方法包括:基于已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系、每个用户群的群特征,确定每个用户群的群向量、和将各未归类用户群确定为预定类型的用户群的第一概率,并将各已归类用户群确定为预定类型的用户本文档来自技高网...

【技术保护点】
1.一种对未归类用户群进行归类的方法,其特征在于,所述方法包括:基于已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系、每个用户群的群特征,确定每个用户群的群向量、和将各未归类用户群确定为预定类型的用户群的第一概率,并将各已归类用户群确定为预定类型的用户群的第一概率设为固定值;基于已归类用户群和未归类用户群中的各用户群之间用户之间的好友关系、确定的各用户群的群向量、和将各用户群确定为预定类型的用户群的第一概率,确定将各未归类用户群确定为预定类型的用户群的第二概率;根据未归类用户群的第二概率,将所述未归类用户群归类。

【技术特征摘要】
1.一种对未归类用户群进行归类的方法,其特征在于,所述方法包括:基于已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系、每个用户群的群特征,确定每个用户群的群向量、和将各未归类用户群确定为预定类型的用户群的第一概率,并将各已归类用户群确定为预定类型的用户群的第一概率设为固定值;基于已归类用户群和未归类用户群中的各用户群之间用户之间的好友关系、确定的各用户群的群向量、和将各用户群确定为预定类型的用户群的第一概率,确定将各未归类用户群确定为预定类型的用户群的第二概率;根据未归类用户群的第二概率,将所述未归类用户群归类。2.根据权利要求1所述的方法,其特征在于,所述基于已归类用户群和未归类用户群中的各用户群之间用户之间的好友关系、确定的各用户群的群向量、和将各用户群确定为预定类型的用户群的第一概率,确定将各未归类用户群确定为预定类型的用户群的第二概率,包括:基于已归类用户群和未归类用户群中的各用户群之间用户之间的好友关系、确定的各用户群的群向量、和将各用户群确定为预定类型的用户群的第一概率,确定将各未归类用户群确定为预定类型的用户群的第二概率、和与第二概率对应的置信度;所述根据未归类用户群的第二概率,将所述未归类用户群归类,包括:将所述第二概率大于预定概率阈值的未归类用户群,确定为候选未归类用户群;按照所述置信度,对候选未归类用户群进行排序;按照对候选未归类用户群的排序结果,确定归类为预定类型的用户群。3.根据权利要求2所述的方法,其特征在于,在按照对候选未归类用户群的排序结果,确定归类为预定类型的用户群的用户群之后,所述方法还包括:将确定的归类为预定类型的用户群的用户群,作为已归类用户群,所述确定每个用户群的群向量、和将各用户群确定为预定类型的用户群的第一概率的步骤、所述确定将各用户群确定为预定类型的用户群的第二概率的步骤、所述将该未归类用户群归类的步骤是迭代执行的,直到已归类用户群的个数达到已归类用户群个数阈值。4.根据权利要求3所述的方法,其特征在于,所述按照对候选未归类用户群的排序结果,确定归类为预定类型的用户群的用户群,包括:从归类为预定类型的用户群中,按照对候选未归类用户群的结果,将排序在前tλ位的用户群,确定为已归类用户群,其中,t为当前迭代次数,λ为超参。5.根据权利要求1所述的方法,其特征在于,所述将各已归类用户群确定为预定类型的用户群的第一概率设为固定值,包括:将各已归类用户群确定为预定类型的用户群的第一概率设为1。6.根据权利要求1所述的方法,其特征在于,所述基于已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系、每个用户群的群特征,确定每个用户群的群向量、和将各未归类用户群确定为预定类型的用户群的第一概率,包括:获取已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系矩阵,所述好友关系矩阵中每行以及每列都代表用户群内部的一个用户,该行上每一列处的元素代表该行代表的用户、与该列代表的用户的好友关系分数值;获取各用户群的群特征;将已归类用户群和未归类用户群中的各用户群的群特征、和内部用户之间的好友关系矩阵作为图嵌入模型的输入,由图嵌入模型输出每个用户群的群向量、和将各未归类用户群确定为预定类型的用户群的第一概率。7.根据权利要求6所述的方法,其特征在于,所述获取已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系矩阵,包括:获取已归类用户群和未归类用户群中的每个用户群的群成员表;将群成员表中每个用户作为所述好友关系矩阵的行,且将群成员表中每个用户作为所述好友关系矩阵的列;获取各用户群的各用户的好友关系表;针对所述好友关系矩阵中的每行,确定该行对应的用户在所述好友关系表中与该用户具有好友关系的该用户群中其它用户,在该行与所述其它用户对应的列处置1,其它位置置0。8.根据权利要求6所述的方法,其特征在于,所述获取已归类用户群和未归类用户群中的各用户群内部用户之间的好友关系矩阵,包括:获取已归类用户群和未归类用户群中的每个用户群的群成员表;将群成员表中每个群成员作为所述好友关系矩阵的行,且将群成员表中每个群成员作为所述好友关系矩阵的列;获取各用户群的各用户的好友关系表;针对所述好友关系矩阵中的每行,确定该行对应的用户在所述好友关系表中与该用户具有好友关系的该用户群中其它用...

【专利技术属性】
技术研发人员:李佳荣钰黄文炳徐挺洋陈远斌潘煜文郑丰廖晨张杰黄俊洲杨勇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1