【技术实现步骤摘要】
异常数据检测方法、装置、电子设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种异常数据检测方法、装置、电子设备及存储介质。
技术介绍
[0002]相关技术中,主要集中在离线的异常数据识别上,对已有的账号进行异常检测,并直接应用于线上推理,根据用户实际创建的角色,确定产生行为序列的数据,再通过离线分析用户画像来判断账号的异常情况。
[0003]但是,相关技术需要获取已经产生行为序列的数据,因此无法解决游戏新服预约场景的异常数据判断的场景需求,难以保证检测结果的准确性和一致性。
技术实现思路
[0004]有鉴于此,本申请的目的在于提出一种异常数据检测方法、装置、电子设备及存储介质。
[0005]基于上述目的,在第一方面,本申请提供了一种异常数据检测方法,包括:
[0006]获取历史预约数据、实时预约数据和异常模式标签;
[0007]根据所述历史预约数据和异常模式标签训练检测模型;
[0008]根据所述检测模型检测所述实时预约数据以确定所述实时预约数据的异常度;
[0009]确定所述异常度是否高于预设第一异常度阈值;
[0010]响应于所述异常度高于预设第一异常度阈值,则确定所述实时预约数据为异常数据。
[0011]在一种可能的实现方式中,所述获取历史预约数据,包括:
[0012]获取用户数据;
[0013]根据所述用户数据确定与所述用户数据关联的账号数据和历史用户行为数据;
[0014]根据所述账号数据 ...
【技术保护点】
【技术特征摘要】
1.一种异常数据检测方法,其特征在于,包括:获取历史预约数据、实时预约数据和异常模式标签;根据所述历史预约数据和异常模式标签训练检测模型;根据所述检测模型检测所述实时预约数据以确定所述实时预约数据的异常度;确定所述异常度是否高于预设第一异常度阈值;响应于所述异常度高于所述预设第一异常度阈值,则确定所述实时预约数据为异常数据。2.根据权利要求1所述的方法,其特征在于,所述获取历史预约数据,包括:获取用户数据;根据所述用户数据确定与所述用户数据关联的账号数据和历史用户行为数据;根据所述账号数据确定与所述账号数据绑定的网络数据和硬盘数据;根据所述用户数据、账号数据、历史用户行为数据、网络数据和硬盘数据确定所述历史预约数据。3.根据权利要求1所述的方法,其特征在于,所述根据所述历史预约数据和异常模式标签训练检测模型,包括:根据所述历史预约数据确定多个目标训练数据和用户历史画像;根据所述历史预约数据确定预约时间;根据所述预约时间确定所述多个目标训练数据的连续性信息;根据预设编码规则对所述多个目标训练数据进行编码以确定多个目标训练数据编码;关联所述多个目标训练数据编码、用户历史画像和连续性信息以确定训练样本;根据所述训练样本和所述异常模式标签训练所述检测模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述预约时间确定所述多个目标训练数据的连续性信息,包括:根据所述预约时间分别对所述多个目标训练数据顺次排序;根据所述预约时间确定相邻的目标训练数据之间的时间间隔是否小于预设时间间隔;响应于所述相邻的目标训练数据之间的时间间隔小于所述预设时间间隔,则确定所述相邻的目标训练数据具有连续性;响应于所述相邻的目标训练数据之间的时间间隔不小于所述预设时间间隔,则确定所述相邻的目标训练数据不具有连续性。5.根据权利要求3所述的方法,其特征在于,所述根据预设编码规则对所述多个目标训练数据进行编码以确定多个目标训练数据编码,包括:将所述多个目标训练数据进行分类以确定至少两种字符类型;其中,每种字符类型分别对应不同的预设编码;顺次确定所述多个目标训练数据中每个字符对应的所述字符类型,以及所述字符类型连续出现的统计数量;根据所述预设编码和所述统计数量对所述多个目标训练数据中的每个字符进行编码以确定多个目标训练数据编码。6.根据权利要求3所述的方法,其特征在于,所述根据所述训练样本和所述异常模式标签训练所述检测模型,包括:
确定每个所述目标训练数据编码对应的类内向量;选择任意一个所述目标训练数据编码确定为目标筛选条件,根据所述类内向量确定其余每个所述目标训练数据编码与所述目标筛选条件之间的类内距离,得到所述目标筛选条件对应的类内距离;将所述目标筛选条件更新为未被选择过的所述目标训练数据编码中的任意一个目标训练数据编码,重复执行确定其余每个所述目标训练数据编码与所...
【专利技术属性】
技术研发人员:朱钰森,吴剑飞,刘柏,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。