【技术实现步骤摘要】
基于用户行为数据的异常用户群体检测方法、装置、设备
本申请涉及数据分析领域,特别是涉及一种基于用户行为数据的异常用户群体检测方法、装置、计算机设备和存储介质。
技术介绍
现在“羊毛党”活跃于各类互联网平台,针对平台优惠活动,以相对较低成本甚至零成本换取物质上的实惠。“羊毛党”利用大量的手机卡,通过设备批量进行虚假注册、领取活动礼品,给平台带来巨额损失。“羊毛党”用户相对于平台所有用户而言,可以认为是异常用户。对于异常用户行为检测,目前有以下方式:基于箱线图计算下四分位数与上四分位数的位差,认定一定范围外的点即为异常点,但是这种方式的精度欠缺,识别出的异常点比较少;另一种方式是基于距离位置的异常检测,先假设正常用户数据都比较集中,具有比较多的邻居,而异常数据都是孤立的,但是这种方式不适用于“羊毛党”,因为“羊毛党”一般是批量注册、批量领取礼品,表现为群聚特征。由此可见,现有技术对异常用户预测的准确率较低。
技术实现思路
基于此,有必要针对上述技术问题,本申请提供一种基于用户行为数据的异常用户群体检测方法、装置、计算机设备及存储介质,以解决现有技术中对异常用户预测的准确率低的技术问题。一种基于用户行为数据的异常用户群体检测方法,所述方法包括:根据获取的用户行为数据统计每个用户的行为特征,其中,所述行为特征包括用户的UA设备数量、在APP上的活跃天数和模块操作次数;通过概率密度函数计算所述行为特征的高斯分布,得到每一所述行为特征的分布概率;根据预设权重表为 ...
【技术保护点】
1.一种基于用户行为数据的异常用户群体检测方法,其特征在于,所述方法包括:/n获取用户行为数据,根据所述用户行为数据统计每个用户的行为特征,其中,所述行为特征包括用户的UA设备数量、在APP上的活跃天数和模块操作次数;/n通过概率密度函数计算所述行为特征的高斯分布,得到每一项行为特征的分布概率;/n根据预设权重表为不同行为特征的所述分布概率赋予权重,其中,将所述活跃天数、所述模块操作次数的权重设为第一权重,将所述UA设备数量的权重设为第二权重,其中,所述第一权重大于所述第二权重;/n基于所述分布概率、所述权重计算每一用户为正常用户的概率值;并/n将所述概率值与预训练阈值进行对比,将小于所述预训练阈值的概率值对应的用户归入异常用户群体。/n
【技术特征摘要】
1.一种基于用户行为数据的异常用户群体检测方法,其特征在于,所述方法包括:
获取用户行为数据,根据所述用户行为数据统计每个用户的行为特征,其中,所述行为特征包括用户的UA设备数量、在APP上的活跃天数和模块操作次数;
通过概率密度函数计算所述行为特征的高斯分布,得到每一项行为特征的分布概率;
根据预设权重表为不同行为特征的所述分布概率赋予权重,其中,将所述活跃天数、所述模块操作次数的权重设为第一权重,将所述UA设备数量的权重设为第二权重,其中,所述第一权重大于所述第二权重;
基于所述分布概率、所述权重计算每一用户为正常用户的概率值;并
将所述概率值与预训练阈值进行对比,将小于所述预训练阈值的概率值对应的用户归入异常用户群体。
2.根据权利要求1所述的方法,其特征在于,所述用户行为数据保存在预设数据库中,所述预设数据库包括埋点数据表和活动参与表,所述根据获取的用户行为数据统计每个用户的行为特征,包括:
从所述埋点数据表中获取用户的所述UA设备数量;
从所述活动参与表中获取用户在APP上的所述活跃天数、所述模块操作次数;
将所述UA设备数量、所述活跃天数以及所述模块操作次数作为所述用户的行为特征。
3.根据权利要求1所述的方法,其特征在于,在所述将所述概率值与预训练阈值进行对比,将小于所述预训练阈值的概率值对应的用户归入异常用户群体之前,还包括:
获取用户样本数据,并按照预设比例将所述用户样本数据划分为训练数据和测试数据,其中,所述用户样本数据包括用户的实际标签;
计算所述训练数据中样本用户为正常用户的概率值;
将最小概率值作为待训练阈值对所述训练数据进行预测划分,得到预测划分结果;并
根据所述预测划分结果计算所述待训练阈值对应的预测指标;
将所述待训练阈值加上预设间隔值更新所述待训练阈值,并重复预测划分与所述预测指标计算的操作,直到所述待训练阈值满足阈值条件,则将最大预测指标对应的待训练阈值作为所述待确认阈值;
计算所述测试数据为正常用户的概率值,并根据所述测试数据的概率值、所述待确认阈值对所述测试数据进行异常预测;
若得到的异常预测结果与测试数据的实际标签一致性达到设定值,则确定所述待确认阈值为所述预训练阈值。
4.根据权利要求3所述的方法,其特征在于,所述预测划分结果包括:
TP:预测为真且正确,
FP:预测为真且错误,
FN:预测为假且错误,
TN:预测为假且正确,
其中,TP、FN为真,表示预测的结果异常;
TN、FP为假,表示预测的结果为正常,且...
【专利技术属性】
技术研发人员:敖琦,唐炳武,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。