账号检测模型的获取方法、装置、设备、介质、识别方法制造方法及图纸

技术编号:36072965 阅读:12 留言:0更新日期:2022-12-24 10:43
本发明专利技术提供了一种账号检测模型的获取方法、装置、设备、介质、识别方法。账号检测模型用于检测异常账号,账号检测模型的获取方法包括:获取包含多个标签的训练数据,多个标签关联注册信息、实名认证信息、或登录信息中的至少一种;构建待训练变分自编码器模型;以及通过训练数据对待训练变分自编码器模型进行训练,得到账号检测模型。根据本发明专利技术实施例的账号检测模型的获取方法,在账号检测模型的训练过程中,利用训练数据包含多个标签的属性,可以进一步引导变分自编码器模型在不同标签层面上捕捉到数据的隐藏规律,使得账号检测模型具有准确率高、泛化能力强的优点。泛化能力强的优点。泛化能力强的优点。

【技术实现步骤摘要】
账号检测模型的获取方法、装置、设备、介质、识别方法


[0001]本专利技术涉及互联网
,尤其是涉及一种账号检测模型的获取方 法、装置、设备、介质、识别方法。

技术介绍

[0002]在游戏领域,困扰产业界及司法领域的新型问题主要集中在游戏黑灰 产。在当前游戏业态的发展背景下,常见的游戏黑灰产业包括打破或绕开 游戏系统的限制,提供工具和账号、买卖个人信息等寄生于网络游戏行业 的产业链,游戏黑灰产对游戏产业生态造成了严重的影响。为保障游戏业 务安全运营,识别游戏中的异常账号对精准有效地打击游戏黑灰产有着重 要意义。
[0003]目前在对异常账号的识别方式上,依赖人工根据经验进行识别,效率 较低。

技术实现思路

[0004]有鉴于此,本专利技术提供一种账号检测模型的获取方法、装置、设备、 介质、识别方法,便于提高对异常账号识别的效率。
[0005]第一方面,本专利技术实施例提供一种账号检测模型的获取方法,所述账 号检测模型用于检测异常账号,所述方法包括:获取包含多个标签的训练 数据,所述多个标签关联注册信息、实名认证信息、或登录信息中的至少 一种;构建待训练变分自编码器模型;以及通过所述训练数据对所述待训 练变分自编码器模型进行训练,得到所述账号检测模型。
[0006]根据本专利技术第一方面的前述实施方式,所述获取包含多个标签的训练 数据的步骤包括:获取原始数据集,所述原始数据集包括与多个账号对应 的多个原始数据,每个所述原始数据包含所述多个标签;将每个所述原始 数据处理为正样本数据或负样本数据,其中所述正样本数据对应正常账号, 所述负样本数据对应异常账号;将所述正样本数据的集合作为所述训练数 据。
[0007]根据本专利技术第一方面的前述任一实施方式,所述多个标签包括以下中 的两者以上:账号注册的互联网协议地址、账号注册的设备、账号注册的 手机号、账号的角色名称、账号登录的客户端、账号登录的系统类型、账 号的登录次数,账号对应用户的出生日期、账号应用付费的时间间隔、账 号实名认证的时间间隔。
[0008]根据本专利技术第一方面的前述任一实施方式,所述将每个所述原始数据 处理为正样本数据或负样本数据的步骤包括:将所述原始数据集预处理; 根据所述多个标签处理所述原始数据集包括的多个所述原始数据,生成所 述正样本数据、所述负样本数据。
[0009]根据本专利技术第一方面的前述任一实施方式,所述将所述原始数据集预 处理的步骤包括以下中的至少一者:对所述原始数据集去数据异常值处理; 对所述原始数据集去空值处理;对所述原始数据集去重复值处理;对所述 原始数据集归一化处理。
[0010]根据本专利技术第一方面的前述任一实施方式,所述根据所述多个标签处 理所述原始数据集包括的多个所述原始数据,生成所述正样本数据、所述 负样本数据的步骤包括:
根据所述多个标签配置多个异常判定条件;若所 述原始数据满足多个异常判定条件中的至少一个,生成负样本数据;否则, 生成正样本数据。
[0011]根据本专利技术第一方面的前述任一实施方式,所述多个异常判定条件包 括以下中的两者以上:账号对应证件的累计实名认证账号数大于等于第一 阈值;第一预设期间内账号对应证件的实名认证账号数大于等于第二阈值; 第二预设期间内账号对应证件的实名认证设备数大于等于第三阈值;第三 预设期间内账号对应证件的实名认证账号登录的互联网协议地址数大于等 于第四阈值;一天内账号对应证件的实名认证账号数大于等于第五阈值; 一天内账号对应证件的实名认证设备数大于等于第六阈值;一天内账号对 应证件的实名认证账号登录的互联网协议地址数大于等于第七阈值;一天 内账号登录的设备数大于等于第八阈值;一天内账号登录的城市数大于等 于第九阈值;一天内账号登录的产品数大于等于第十阈值。
[0012]根据本专利技术第一方面的前述任一实施方式,所述通过所述训练数据对 所述待训练变分自编码器模型进行训练,得到所述账号检测模型的步骤包 括:采用所述训练数据中的一部分所述正样本数据训练所述待训练变分自 编码器模型;采用所述训练数据中的另一部分所述正样本数据对训练后的 变分自编码器模型验证;在训练后的变分自编码器模型的损失函数趋于保 持不变时,保存训练后的变分自编码器模型为所述账号检测模型。
[0013]根据本专利技术第一方面的前述任一实施方式,所述还包括:定期更新所 述训练数据;通过更新的所述训练数据对所述待训练变分自编码器模型进 行训练,更新所述账号检测模型。
[0014]第二方面,本专利技术实施例提供一种异常账号识别方法,其包括:获取 账号检测模型,包括:获取包含多个标签的训练数据,所述多个标签关联 注册信息、实名认证信息、或登录信息中的至少一种;构建待训练变分自 编码器模型;以及通过所述训练数据对所述待训练变分自编码器模型进行 训练,得到所述账号检测模型;获取待识别账号的待识别数据,所述待识 别数据包含所述多个标签;以及通过所述账号检测模型对所述待识别数据 识别,判断所述待识别账号是否为异常账号。
[0015]第三方面,本专利技术实施例提供一种账号检测模型的获取装置,其包括: 训练数据获取模块,用于获取包含多个标签的训练数据,所述多个标签关 联注册信息、实名认证信息、或登录信息中的至少一种;模型构件模块, 用于构建待训练变分自编码器模型;以及训练模块,用于通过所述训练数 据对所述待训练变分自编码器模型进行训练,得到所述账号检测模型。
[0016]第四方面,本专利技术实施例提供一种电子设备,包括处理器和存储器, 所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器 执行所述机器可执行指令以实现根据本专利技术第一方面的前述任一实施方式 的账号检测模型的获取方法。
[0017]第五方面,本专利技术实施例提供一种机器可读存储介质,其特征在于, 所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被 处理器调用和执行时,所述机器可执行指令促使所述处理器实现根据本发 明第一方面的前述任一实施方式的账号检测模型的获取方法。
[0018]根据本专利技术实施例的账号检测模型的获取方法、装置、设备、介质、 识别方法,账号检测模型通过训练变分自编码器模型得到,在训练中,采 用的训练数据包含多个标签,
该多个标签关联注册信息、实名认证信息、 或登录信息中的至少一种,即训练数据是关联注册信息、实名认证信息、 或登录信息中的至少一种的多维信息。变分自编码器模型是一种无监督的 深度生成模型,能够学习到数据在高维空间的概率分布。在账号检测模型 的训练过程中,利用训练数据包含多个标签的属性,可以进一步引导变分 自编码器模型在不同标签层面上捕捉到数据的隐藏规律,使得账号检测模 型具有准确率高、泛化能力强的优点。在将该账号检测模型用于异常账号 识别后,能够节省大量人力成本,且能提高对异常账号识别的效率。
[0019]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从 说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其 他优点在说明书、权利本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种账号检测模型的获取方法,所述账号检测模型用于检测异常账号,其特征在于,所述方法包括:获取包含多个标签的训练数据,所述多个标签关联注册信息、实名认证信息、或登录信息中的至少一种;构建待训练变分自编码器模型;以及通过所述训练数据对所述待训练变分自编码器模型进行训练,得到所述账号检测模型。2.根据权利要求1所述的方法,其特征在于,所述获取包含多个标签的训练数据的步骤包括:获取原始数据集,所述原始数据集包括与多个账号对应的多个原始数据,每个所述原始数据包含所述多个标签;将每个所述原始数据处理为正样本数据或负样本数据,其中所述正样本数据对应正常账号,所述负样本数据对应异常账号;将所述正样本数据的集合作为所述训练数据。3.根据权利要求2所述的方法,其特征在于,所述多个标签包括以下中的两者以上:账号注册的互联网协议地址、账号注册的设备、账号注册的手机号、账号的角色名称、账号登录的客户端、账号登录的系统类型、账号的登录次数,账号对应用户的出生日期、账号应用付费的时间间隔、账号实名认证的时间间隔。4.根据权利要求2所述的方法,其特征在于,所述将每个所述原始数据处理为正样本数据或负样本数据的步骤包括:将所述原始数据集预处理;根据所述多个标签处理所述原始数据集包括的多个所述原始数据,生成所述正样本数据、所述负样本数据。5.根据权利要求4所述的方法,其特征在于,所述将所述原始数据集预处理的步骤包括以下中的至少一者:对所述原始数据集去数据异常值处理;对所述原始数据集去空值处理;对所述原始数据集去重复值处理;对所述原始数据集归一化处理。6.根据权利要求4所述的方法,其特征在于,所述根据所述多个标签处理所述原始数据集包括的多个所述原始数据,生成所述正样本数据、所述负样本数据的步骤包括:根据所述多个标签配置多个异常判定条件;若所述原始数据满足多个异常判定条件中的至少一个,生成负样本数据;否则,生成正样本数据。7.根据权利要求6所述的方法,其特征在于,所述多个异常判定条件包括以下中的两者以上:账号对应证件的累计实名认证账号数大于等于第一阈值;第一预设期间内账号对应证件的实名认证账号数大于等于第二阈值;第二预设期间内账号对应证件的实名认证设备数大于等于第三阈值;
第三预设期间内账号对应证件的实名认证账号登录的互联网协议地址数大于等于第四阈值;一天内账号对应证件的实名认证账号数大...

【专利技术属性】
技术研发人员:曹慧霞梁兆豪
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1