【技术实现步骤摘要】
异常检测方法及装置
[0001]本申请涉及数据处理
,具体涉及一种异常检测方法及装置。
技术介绍
[0002]电商行业的迅速发展,导致部分电商店铺通过虚假发货、虚假评价的方式制造假的“优质数据”,以提高店铺对外展示的销售量和评价结果。针对这类行为,当前主要由电商平台将店铺作为管控对象,通过查看店铺的转化率、购物集中时间、搜索情况等方面来识别存在虚假数据的店铺,这种方式缺乏对消费用户层面的监管,从而无法有效减少通过虚假交易制造虚假数据的行为。
技术实现思路
[0003]为此,本申请提供一种异常检测方法及装置,以解决无法较为全面准确地检测电商平台中制造假数据的行为,导致电商数据不准确,影响用户交易的问题。
[0004]为了实现上述目的,本申请第一方面提供一种异常检测方法,该方法包括:
[0005]获取待检测数据,所述待检测数据包括第一用户的数据以及与所述第一用户相关联的第二用户的数据;
[0006]将所述待检测数据按照预设特征维度进行分类,获得分类特征数据;
[0007]将所 ...
【技术保护点】
【技术特征摘要】
1.一种异常检测方法,其特征在于,所述方法包括:获取待检测数据,所述待检测数据包括第一用户的数据以及与所述第一用户相关联的第二用户的数据;将所述待检测数据按照预设特征维度进行分类,获得分类特征数据;将所述分类特征数据输入对应的预设决策树中,获得各个所述预设决策树的分类子结果;根据多个所述分类子结果,确定所述第一用户的异常检测结果,所述异常检测结果用于表征所述第一用户是否存在异常。2.根据权利要求1所述的异常检测方法,其特征在于,所述预设决策树是通过对随机森林模型进行训练获得的决策树,所述随机森林模型为基于随机森林建立的、用于生成所述预设决策树以进行异常检测的模型。3.根据权利要求2所述的异常检测方法,其特征在于,所述方法还包括:确定多个所述预设特征维度;将训练数据按照所述预设特征维度进行分类,获得分类特征训练数据;计算各个分类特征训练数据的基尼系数,基于所述基尼系数确定各级分类节点;基于所述各级分类节点生成对应的预设决策树,获得所述随机森林模型。4.根据权利要求3所述的异常检测方法,其特征在于,所述计算各个分类特征训练数据的基尼系数,基于所述基尼系数确定各级分类节点,包括:计算各个所述分类特征训练数据的基尼系数,确定第一级最小基尼系数;将所述第一级最小基尼系数对应的分类特征作为第一级分类节点,并根据所述第一级分类节点将所述分类特征训练数据划分为多个第一级分支训练数据;针对各个第n
‑
1级分支训练数据,计算所述第n
‑
1级分支训练数据的基尼系数,确定第n级最小基尼系数,将所述第n级最小基尼系数对应的分类特征作为第n级分类节点,并根据所述第n级分类节点将所述第n
‑
1级分支训练数据划分为多个第n级分支训练数据,n为大于或等于2的整数;在满足预设停止条件的情况下,停止数据划分操作,获得各级分类节点。5.根据权利要求1所述的异...
【专利技术属性】
技术研发人员:李堃,蔡一欣,赵慧,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。