恶意账号识别方法、恶意账号识别装置、介质及电子设备制造方法及图纸

技术编号:24763805 阅读:38 留言:0更新日期:2020-07-04 11:03
本申请提供一种恶意账号识别方法、恶意账号识别装置、计算机可读存储介质及电子设备;涉及计算机技术领域;包括:根据预设分组条件对采集的用户数据对应的用户账号分组;计算各组间的第一相似度;根据第一相似度构建节点关系图;计算图中各组的节点特征分别与节点关系图的全局特征间的第二相似度;根据第二相似度选取目标节点;根据各组间的连接权重计算各组的分值,并根据分值从目标节点中选取第一特定节点;根据预设判定规则从第一特定节点内识别恶意账号。上述方法能够提升对于恶意账号的识别准确率。

Malicious account identification method, malicious account identification device, medium and electronic device

【技术实现步骤摘要】
恶意账号识别方法、恶意账号识别装置、介质及电子设备
本申请涉及计算机
,具体而言,涉及一种恶意账号识别方法、恶意账号识别装置、计算机可读存储介质及电子设备。
技术介绍
电商平台、短消息发布平台等多种平台中大都存在恶意账号。恶意账号通常具有一定的规模和相似性,用于大量的占用电商平台的优惠活动名额,或者,用于提升短消息发布平台中发布消息的博主的粉丝数量。而恶意账号的存在会扰乱各平台的营运秩序,增加服务器的计算负担。基于上述情况,各平台通常会对用户账号的行为进行识别,若识别出某一账号的行为异常,则将该账号判定为恶意账号。但是,这种方法通常会误将正常账号识别为恶意账号,即,存在识别准确率不高的问题。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本申请的目的在于提供一种恶意账号识别方法、恶意账号识别装置、计算机可读存储介质及电子设备,通过对用户账号分组,根据用户账号之间的相似性构建节点关系图,以及结合用户账号的交易数据识别该用户账号是否为恶意账号,可以提升对于恶意账号的识别准确率。本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。根据本申请的第一方面,提供一种恶意账号识别方法,包括:采集特定事件对应的用户数据,并根据预设分组条件对用户数据对应的用户账号进行分组,得到分组结果;其中,用户数据包括用户画像数据和用户行为数据;计算分组结果中各组之间的第一相似度,并根据第一相似度构建由各组作为节点的节点关系图;计算节点关系图中各组对应的节点特征分别与节点关系图对应的全局特征之间的第二相似度,并根据第二相似度从节点关系图中选取目标节点;根据各组之间的连接权重计算各组对应的分值,并根据分值从目标节点中选取第一特定节点;根据预设判定规则从第一特定节点内的用户账号中识别恶意账号。在本申请的一种示例性实施例中,采集特定事件对应的用户数据,包括:根据特定事件对应的发布方式确定数据采集方式;其中,发布方式包括客户端发布和网页发布;根据数据采集方式采集特定事件对应的用户数据。在本申请的一种示例性实施例中,用户画像数据包括性别、年龄、账号注册时长、账号活跃度以及历史消费数据;用户行为数据包括事件参与时间、注册地址、注册设备以及联系方式。在本申请的一种示例性实施例中,预设分组条件包括预设时长、注册地址以及注册设备中至少一种,根据预设分组条件对用户数据对应的用户账号进行分组,得到分组结果,包括:根据预设时长对用户数据对应的用户账号进行分组,得到时长分组结果;根据注册地址对时长分组结果进行分组,得到分组结果,其中,分组结果中的组数量大于等于时长分组结果中的组数量;或者,根据预设时长对用户数据对应的用户账号进行分组,得到时长分组结果;根据注册设备对时长分组结果进行分组,得到分组结果;其中,分组结果中的组数量大于等于时长分组结果的组数量。在本申请的一种示例性实施例中,计算分组结果中各组之间的第一相似度,包括:根据用户账号对应的属性数据确定分组结果中各组对应的属性分布;其中,属性数据包括好友数量、账号等级以及历史行为中至少一种;计算各属性分布之间的第一相似度。在本申请的一种示例性实施例中,计算各属性分布之间的第一相似度,包括:计算属性分布两两之间的正向散度和反向散度,并将正向散度与反向散度之和确定为属性分布两两之间的第一相似度;或者,对各属性分布进行数据归一化,并将属性分布对应的归一化结果转换至特定维度,计算特定维度下各归一化结果之间的距离,作为属性分布两两之间的第一相似度。在本申请的一种示例性实施例中,根据第一相似度构建由各组作为节点的节点关系图,包括:根据第一相似度确定各组之间的连接权重,并通过权重阈值对连接权重进行筛选;依据筛选结果构建由各组作为节点的节点关系图。在本申请的一种示例性实施例中,计算节点关系图中各组对应的节点特征分别与节点关系图对应的全局特征之间的第二相似度,包括:确定节点关系图中各组内针对特定事件每个用户账号对应的属性数据和当前交易数据;根据对属性数据和当前交易数据的综合统计,确定各组对应的节点特征,并根据节点特征确定节点关系图对应的全局特征;计算节点特征与全局特征之间的第二相似度。在本申请的一种示例性实施例中,计算节点关系图中各组对应的节点特征分别与节点关系图对应的全局特征之间的第二相似度,包括:确定节点关系图中各组内每个用户账号对应的历史交易数据以及针对特定事件每个用户账号对应的属性数据和当前交易数据;根据对历史交易数据、属性数据和当前交易数据的综合统计,确定各组对应的节点特征,并根据节点特征确定节点关系图对应的全局特征;计算节点特征与全局特征之间的第二相似度。在本申请的一种示例性实施例中,根据各组之间的连接权重计算各组对应的分值,包括:根据各组之间的连接关系计算各组对应的连接权重之和,并计算各组对应的各连接权重分别与连接权重之和的比例,以及,根据比例计算各组对应的影响因子和分值;根据前一代对应的分值和影响因子计算当前一代对应的分值,直到完成预设次数的迭代;将预设次数中所述各组最后一次迭代的分值确定为各组对应的分值。在本申请的一种示例性实施例中,根据预设判定规则从第一特定节点内的用户账号中识别恶意账号之前,上述方法还可以包括以下步骤:计算各组内的用户账号相似度,若存在目标组,则将目标组对应的节点确定为第二特定节点,目标组内的用户账号相似度大于预设相似度。在本申请的一种示例性实施例中,根据预设判定规则从第一特定节点内的用户账号中识别恶意账号,包括:计算第一特定节点和第二特定节点的并集,将并集中的节点确定为节点关系图中的可疑节点;根据预设判定规则从可疑节点内的用户账号中识别恶意账号。在本申请的一种示例性实施例中,预设判定规则包括预设阈值或先验信息,根据预设判定规则从可疑节点内的用户账号中识别恶意账号,包括:从可疑节点内选取数量大于预设阈值的目标用户账号并将目标用户账号识别为恶意账号,其中,各目标用户账号之间的相似度大于目标用户账号与可疑节点内其他用户账号的相似度;或者,根据先验信息对可疑节点内的用户账号进行筛选,将筛选后的用户账号识别为恶意账号。根据本申请的第二方面,提供一种恶意账号识别装置,包括账号分组单元、节点关系图构建单元、节点选取单元以及恶意账号识别单元,其中:账号分组单元,用于采集特定事件对应的用户数据,并根据预设分组条件对用户数据对应的用户账号进行分组,得到分组结果;其中,用户数据包括用户画像数据和用户行为数据;节点关系图构建单元,用于计算分组结果中各组之间的第一相似度,并根据第一相似度构建由各组作为节点的节点关系图本文档来自技高网...

【技术保护点】
1.一种恶意账号识别方法,其特征在于,包括:/n采集特定事件对应的用户数据,并根据预设分组条件对所述用户数据对应的用户账号进行分组,得到分组结果;其中,所述用户数据包括用户画像数据和用户行为数据;/n计算所述分组结果中各组之间的第一相似度,并根据所述第一相似度构建由所述各组作为节点的节点关系图;/n计算所述节点关系图中各组对应的节点特征分别与所述节点关系图对应的全局特征之间的第二相似度,并根据所述第二相似度从所述节点关系图中选取目标节点;/n根据所述各组之间的连接权重计算所述各组对应的分值,并根据所述分值从所述目标节点中选取第一特定节点;/n根据预设判定规则从所述第一特定节点内的用户账号中识别恶意账号。/n

【技术特征摘要】
1.一种恶意账号识别方法,其特征在于,包括:
采集特定事件对应的用户数据,并根据预设分组条件对所述用户数据对应的用户账号进行分组,得到分组结果;其中,所述用户数据包括用户画像数据和用户行为数据;
计算所述分组结果中各组之间的第一相似度,并根据所述第一相似度构建由所述各组作为节点的节点关系图;
计算所述节点关系图中各组对应的节点特征分别与所述节点关系图对应的全局特征之间的第二相似度,并根据所述第二相似度从所述节点关系图中选取目标节点;
根据所述各组之间的连接权重计算所述各组对应的分值,并根据所述分值从所述目标节点中选取第一特定节点;
根据预设判定规则从所述第一特定节点内的用户账号中识别恶意账号。


2.根据权利要求1所述的方法,其特征在于,采集特定事件对应的用户数据,包括:
根据所述特定事件对应的发布方式确定数据采集方式;其中,所述发布方式包括客户端发布和网页发布;
根据所述数据采集方式采集所述特定事件对应的所述用户数据。


3.根据权利要求1所述的方法,其特征在于,所述用户画像数据包括性别、年龄、账号注册时长、账号活跃度以及历史消费数据;所述用户行为数据包括事件参与时间、注册地址、注册设备以及联系方式。


4.根据权利要求3所述的方法,其特征在于,所述预设分组条件包括预设时长、所述注册地址以及所述注册设备中至少一种,根据预设分组条件对所述用户数据对应的用户账号进行分组,得到分组结果,包括:
根据所述预设时长对所述用户数据对应的用户账号进行分组,得到时长分组结果;根据所述注册地址对所述时长分组结果进行分组,得到所述分组结果,其中,所述分组结果中的组数量大于等于所述时长分组结果中的组数量;
或者,
根据所述预设时长对所述用户数据对应的用户账号进行分组,得到时长分组结果;根据所述注册设备对所述时长分组结果进行分组,得到所述分组结果;其中,所述分组结果中的组数量大于等于所述时长分组结果的组数量。


5.根据权利要求1所述的方法,其特征在于,计算所述分组结果中各组之间的第一相似度,包括:
根据所述用户账号对应的属性数据确定所述分组结果中各组对应的属性分布;其中,所述属性数据包括好友数量、账号等级以及历史行为中至少一种;
计算各所述属性分布之间的第一相似度。


6.根据权利要求5所述的方法,其特征在于,计算各所述属性分布之间的第一相似度,包括:
计算所述属性分布两两之间的正向散度和反向散度,并将所述正向散度与所述反向散度之和确定为所述属性分布两两之间的第一相似度;
或者,
对各所述属性分布进行数据归一化,并将所述属性分布对应的归一化结果转换至特定维度,计算所述特定维度下各所述归一化结果之间的距离,作为所述属性分布两两之间的第一相似度。


7.根据权利要求1所述的方法,其特征在于,根据所述第一相似度构建由所述各组作为节点的节点关系图,包括:
根据所述第一相似度确定所述各组之间的连接权重,并通过权重阈值对所述连接权重进行筛选;
依据筛选结果构建由所述各组作为节点的节点关系图。


8.根据权利要求1所述的方法,其特征在于,计算所述节点关系图中各组对应的节点特征分别与所述节点关系图对应的全局特征之间的第二相似度,包括:
确定所述节点关系图中各组内针对所述特定事件每个用户账号对应的属性数据和当前交易数据;
根据对所述属性数据和所述当前交易数据的综合统计,确定所述各组对应的节点特征,并根据所述节点特征确定所述节点关系图对应的全局特征;
计算所述节点特征与所述全局特征之间的第二相似度。<...

【专利技术属性】
技术研发人员:陈辉亮金洪波金欢
申请(专利权)人:深圳市腾讯计算机系统有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1