一种数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39294774 阅读:19 留言:0更新日期:2023-11-07 11:02
本申请实施例公开了一种数据处理方法、装置、计算机设备及存储介质,可应用于人工智能场景,包括:在获取到待检测的业务账号时,确定业务粗标签以及业务账号对应的业务账号关系;业务账号关系包括第一业务账号关系和第二业务账号关系;基于第一业务账号关系所关联的对象以及第二业务账号关系所关联的虚拟群组,建立业务账号对应的业务异构图,基于业务异构图,生成第一业务表征向量;基于业务粗标签以及业务账号对应的原始特征,确定原始业务表征向量,对第一业务表征向量以及原始业务表征向量进行拼接处理,得到第二业务表征向量;第二业务表征向量用于预测业务账号的合法性。采用本申请实施例,可以提升账号检测的准确度。可以提升账号检测的准确度。可以提升账号检测的准确度。

【技术实现步骤摘要】
一种数据处理方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,越来越多的用户通过在应用客户端上注册账号来更加便捷的获取网络信息,但非法用户为了谋取暴利,往往会恶意注册一些帐号(即非法账号)来传播非法信息流,从而极大程度的影响了正常用户的用户体验,因此,如何有效、准确地检测此类非法账号显得尤为重要。然而,在传统恶意的检测方法中,往往通过获取待检测的账号的真实物理关系(例如,好友关系、相同设备关系)等,来构建该账号的社交拓扑结构图。其中,这里的社交拓扑结构图可以用于检测该账号是否为恶意注册的账号。但是,对于新注册的账号而言,由于新注册的账号使用时间短,留下的足迹少,因此仅靠这种真实物理关系构建的社交拓扑结构图还是比较稀疏的,这将造成后续采用该社交拓扑结构图所得到的账号检测结果不够准确。

技术实现思路

[0003]本申请实施例提供一种数据处理方法、装置、计算机设备及存储介质,可以提升账号检测的准确度。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:在获取到待检测的业务账号时,确定所述业务账号的业务粗标签以及所述业务账号对应的业务账号关系;所述业务账号关系包括第一业务账号关系和第二业务账号关系;所述第一业务账号关系用于关联与所述业务账号具有相同属性的对象;所述第二业务账号关系用于关联所述业务账号的虚拟群组;所述虚拟群组中的账号与所述业务账号具有关联属性,且所述虚拟群组不属于在应用客户端中进行通讯的公共群组;基于所述第一业务账号关系所关联的对象以及所述第二业务账号关系所关联的虚拟群组,建立所述业务账号对应的业务异构图,基于所述业务异构图,生成所述业务账号对应的第一业务表征向量;基于所述业务粗标签以及所述业务账号对应的原始特征,确定所述业务账号对应的原始业务表征向量,对所述第一业务表征向量以及所述原始业务表征向量进行拼接处理,得到所述业务账号对应的第二业务表征向量;所述第二业务表征向量用于预测所述业务账号的合法性。2.根据权利要求1所述的方法,其特征在于,所述在获取到待检测的业务账号时,确定所述业务账号的业务粗标签以及所述业务账号对应的业务账号关系,包括:在获取到待检测的业务账号时,基于针对所述业务账号的注册评估策略,确定所述业务账号的业务粗标签;基于所述应用客户端,确定所述业务账号对应的第一业务账号关系;查找与所述业务账号具有相似属性的账号,将具有同一相似属性的账号进行群组模拟构建,得到X1个虚拟群组,分别建立每个虚拟群组与所述业务账号之间的账号关系,将X1个账号关系作为所述业务账号对应的第二业务账号关系;X1为正整数;将所述第一业务账号关系和所述第二业务账号关系确定为所述业务账号对应的业务账号关系。3.根据权利要求2所述的方法,其特征在于,所述注册评估策略包括第一评估策略;所述第一评估策略包括非法信息流以及次数阈值;所述在获取到待检测的业务账号时,基于针对所述业务账号的注册评估策略,确定所述业务账号的业务粗标签,包括:在获取到待检测的业务账号时,从所述业务账号对应的原始特征中,获取所述业务账号在评估周期内的第一交互特征;若所述第一交互特征指示所述业务账号发送过所述非法信息流,且信息流发送次数达到次数阈值,则将用于表征不具备合法性的第一标签作为所述业务账号的业务粗标签;若所述第一交互特征指示所述业务账号发送过所述非法信息流,且信息流发送次数未达到次数阈值,则将用于表征不确定性的第二标签作为所述业务账号的业务粗标签;若所述第一交互特征指示所述业务账号未发送过所述非法信息流,则将用于表征具备合法性的第三标签作为所述业务账号的业务粗标签。4.根据权利要求2所述的方法,其特征在于,所述注册评估策略包括第二评估策略;所述第二评估策略包括在单位时长内所设定的第一频率阈值和第二频率阈值,所述第一频率阈值大于所述第二频率阈值;所述在获取到待检测的业务账号时,基于针对所述业务账号的注册评估策略,确定所
述业务账号的业务粗标签,包括:在获取到待检测的业务账号时,从所述业务账号对应的原始特征中,获取所述业务账号在评估周期内的第二交互特征,基于所述第二交互特征,确定所述业务账号在所述单位时长内执行账号添加操作的添加频率;若所述添加频率达到所述第一频率阈值,则将用于表征不具备合法性的第一标签作为所述业务账号的业务粗标签;若所述添加频率未达到所述第二频率阈值,则将用于表征不确定性的第二标签作为所述业务账号的业务粗标签;若所述添加频率大于所述第二频率阈值,且未达到所述第一频率阈值,则将用于表征具备合法性的第三标签作为所述业务账号的业务粗标签。5.根据权利要求2所述的方法,其特征在于,所述基于所述应用客户端,确定所述业务账号对应的第一业务账号关系,包括:若所述应用客户端为社交客户端,则获取所述业务账号对应的X2个地址标识,分别建立每个地址标识与所述业务账号之间的账号关系,得到X2个账号关系;X2为正整数;获取包含所述业务账号的X3个公共群组,分别建立每个公共群组与所述业务账号之间的账号关系,得到X3个账号关系;X3为正整数;将所述X2个账号关系和所述X3个账号关系确定为所述业务账号对应的第一业务账号关系。6.根据权利要求2所述的方法,其特征在于,所述查找与所述业务账号具有相似属性的账号,将具有同一相似属性的账号进行群组模拟构建,得到X1个虚拟群组,分别建立每个虚拟群组与所述业务账号之间的账号关系,将X1个账号关系作为所述业务账号对应的第二业务账号关系,包括:从所述业务账号的属性集合中选择M个属性,基于所述M个属性,生成X1个待匹配属性;M为正整数;所述X1个待匹配属性中的任意两个待匹配属性所包含的属性互不相同;所述X1个待匹配属性包括待处理属性;从所述应用客户端所注册的原始账号集合中,获取与所述待处理属性相匹配的账号集合,对获取到的账号集合中的账号进行群组模拟构建,得到所述待处理属性对应的虚拟群组;当获取到所述X1个待匹配属性分别对应的虚拟群组时,分别建立每个虚拟群组与所述业务账号之间的账号关系,将X1个账号关系作为所述业务账号对应的第二业务账号关系。7.根据权利要求6所述的方法,其特征在于,所述业务账号中的属性集合包括与账号名称相关联的第一属性、与账号头像相关联的第二属性、与注册信息相关联的第三属性以及与交互特征相关联的第四属性;所述待匹配属性包括所述第一属性、所述第二属性、所述第三属性以及所述第四属性中的至少一个。8.根据权利要求1所述的方法,其特征在于,所述基于所述第一业务账号关系所关联的对象以及所述第二业务账号关系所关联的虚拟群组,建立所述业务账号对应的业务异构图,基于所述业务异构图,生成所述业务账号对应的第一业务表征向量,包括:基于所述第一业务账号关系所关联的对象以及所述第二业务账号关系所关联的虚拟群组,建立所述业务账号对应的业务异构图;所述业务异构图中包括Y个节点;Y为正整数;
基于所述业务异构图,确定所述Y个节点中的每个节点的初始向量;所述初始向量用于表征所述对应节点的节点信息;获取到针对所述业务账号的目标注册评估模型;所述目标注册评估模型包括目标编码子模型;将所述Y个初始向量输入至所述目标编码子模型,通过所述目标编码子模型,对所述业务账号进行编码处理,得到所述业务账号对应的第一业务表征向量。9.根据权利要求8所述的方法,其特征在于,所述将所述Y个初始向量输入至所述目标编码子模型,通过所述目标编码子模型,对所述业务账号进行编码处理,得到所述业务账号对应的第一业务表征向量,包括:在所述目标编码子模型中,基于所述Y个初始向量以及用于进行维度对齐的映射矩阵,分...

【专利技术属性】
技术研发人员:曾培智陈少杰祁麟
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1