【技术实现步骤摘要】
基于人工智能的黑产账号检测方法及相关装置
本申请涉及人工智能
,具体而言,涉及一种基于人工智能的黑产账号检测方法及相关装置。
技术介绍
一般地,黑产,指以互联网为媒介,以网络技术为主要手段,为计算机信息系统安全和网络空间管理秩序,甚至国家安全、社会政治稳定带来潜在威胁(重大安全隐患)的非法行为。例如,黑产可以通过模拟器模拟出大量手机设备伪装真实用户账号进行刷量。随着技术的进步,黑产攻击已经成为各大公司非常重视的问题,无时无刻不在面临着黑产的攻击。黑产无论是如何变现,都需要先注册大量的虚假账号,以量攻击。目前,业务风险识别需要打击黑产的行为,识别打击虚假黑产账号。业内目前主要是通过专家经验规则来识别和打击虚假账号。专家规则识别面比较单一,比较窄,主要是定向精准识别和打击,因为逻辑较简单,容易被黑产行为识别和绕过。
技术实现思路
本申请的目的在于提供一种基于人工智能的黑产账号检测方案,进而至少在一定程度上有效提升黑产账号检测的准确性及可靠性。根据本申请的一个方面,提供一种基于人工智能的黑产账号检
【技术保护点】
1.一种基于人工智能的黑产账号检测方法,其特征在于,包括:/n获取目标主体所关联用户账号的账号属性数据集,所述账号属性数据集中包括第一数据集及第二数据集,所述第一数据集属于白名单用户账号,所述第二数据集属于待检测用户账号;/n从所述第一数据集中获取待检测字段的字段数据所对应手机号的第一平均个数,及从所述第二数据集中获取所述待检测字段的字段数据所对应手机号的第二平均个数,并将所述第一平均个数小于所述第二平均个数的待检测字段确定为检测字段;/n将所述检测字段在所述账号属性数据集中的字段数据作为连接边,并将所述检测字段的字段数据所对应手机号作为顶点,构建账号检测图;/n基于所述账 ...
【技术特征摘要】
1.一种基于人工智能的黑产账号检测方法,其特征在于,包括:
获取目标主体所关联用户账号的账号属性数据集,所述账号属性数据集中包括第一数据集及第二数据集,所述第一数据集属于白名单用户账号,所述第二数据集属于待检测用户账号;
从所述第一数据集中获取待检测字段的字段数据所对应手机号的第一平均个数,及从所述第二数据集中获取所述待检测字段的字段数据所对应手机号的第二平均个数,并将所述第一平均个数小于所述第二平均个数的待检测字段确定为检测字段;
将所述检测字段在所述账号属性数据集中的字段数据作为连接边,并将所述检测字段的字段数据所对应手机号作为顶点,构建账号检测图;
基于所述账号检测图中第一类型字段的字段数据对所述账号检测图进行图聚类,得到账号聚类簇,所述第一类型字段指示账号登录地址相关字段;
基于所述账号聚类簇中第二类型字段的字段数据,验证所述账号聚类簇是否异常,识别出异常账号团伙,所述第二类型字段为除所述第一类型字段之外的其它字段。
2.根据权利要求1所述的方法,其特征在于,所述从所述第一数据集中获取待检测字段的字段数据所对应手机号的第一平均个数,及从所述第二数据集中获取所述待检测字段的字段数据所对应手机号的第二平均个数,包括:
获取所述第一数据集中所述待检测字段的所有所述字段数据对应的第一手机号个数之和,并获取所述第二数据集中所述待检测字段的所有所述字段数据对应的第二手机号个数之和;
计算所述第一数据集中所述待检测字段的所有所述字段数据的第一字段数据个数,并计算所述第二数据集中所述待检测字段的所有所述字段数据的第二字段数据个数;
利用所述第一手机号个数之和除以所述第一字段数据个数得到所述第一平均个数,并利用所述第二手机号个数之和除以所述第二字段数据个数得到所述第二平均个数。
3.根据权利要求2所述的方法,其特征在于,所述获取所述第二数据集中所述待检测字段的所有所述字段数据对应的第二手机号个数之和,包括:
获取所述第二数据集中所述待检测字段的每个所述字段数据对应的第二手机号个数,并根据所述第二手机号个数将所述待检测字段的每个所述字段数据按照由大到小的顺序排序,得到字段数据序列;
将所述字段数据序列中预定比例个位于首尾两端的字段数据剔除,得到字段剩余的字段数据,并获取所述剩余的字段数据对应的手机号个数之和,作为所述第二手机号个数之和;
所述计算所述第二数据集中所述待检测字段的所有所述字段数据的第二字段数据个数,包括:
计算所述第二数据集中所述待检测字段的所述剩余的字段数据的个数之和,作为所述第二字段数据个数。
4.根据权利要求1所述的方法,其特征在于,所述将所述检测字段在所述账号属性数据集中的字段数据作为连接边,并将所述检测字段的字段数据所对应手机号作为顶点,构建账号检测图,包括:
获取所述检测字段中的指纹型字段和类别型字段,所述指纹型字段至少包括登录设备标识、登录密码和登录设备开机时间,所述类别型字段至少包括登录设备机型、系统版本、设备总存储空间、登录网络地址及无线网卡的物理地址;
从所述账号属性数据集中获取字段数据组合作为连接边,并将所述字段数据组合对应的手机号作为顶点构建账号检测图,所述字段数据组合包括第一预定数目个所述指纹型字段的组合所对应数据及第二预定数目个所述类别型字段的组合所对应数据。
5.根据权利要求4所述的方...
【专利技术属性】
技术研发人员:孙家棣,马宁,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。