System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 异常用户的识别模型的确定方法、装置、存储介质和产品制造方法及图纸_技高网

异常用户的识别模型的确定方法、装置、存储介质和产品制造方法及图纸

技术编号:41270024 阅读:6 留言:0更新日期:2024-05-11 09:24
本公开涉及一种异常用户的识别模型的确定方法、装置、存储介质和产品,涉及计算机技术领域。异常用户的识别模型的确定方法包括:基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度;基于第一准确度,从多个分类模型中选取多个目标分类模型;基于用户数据中的测试数据集,确定多个融合模型中的每个融合模型区分正常用户和异常用户的第二准确度,其中,多个融合模型是通过多种融合方法将多个目标分类模型进行融合而获得的;基于第二准确度,从多个融合模型中选取目标融合模型,将目标融合模型确定为异常用户的识别模型。

【技术实现步骤摘要】

本公开涉及计算机,特别涉及一种异常用户的识别模型的确定方法、装置、存储介质和产品


技术介绍

1、在当前数字化时代背景下,互联网定制的促销活动日益流行。例如用户可以通过线下扫码或观看线上直播参与促销活动,从而增强用户的参与度,增强产品的市场活力。然而,促销活动也会激发一些异常用户利用促销规则的漏洞进行不正当获利。

2、现有的识别和预测异常用户的手段主要是基于业务数据规则分析以及人工监控,效率低下,适应性差,无法及时处理大规模数据和进行实时检测。


技术实现思路

1、专利技术人研究发现,考虑构建一种基于自动化机器学习的识别模型,通过识别模型识别异常用户来能够极大地提升识别异常用户的效率。

2、本公开所要解决的一个技术问题是:如何提高识别异常用户的效率。

3、根据本公开的一些实施例,提供了一种异常用户的识别模型的确定方法,包括:基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度;基于第一准确度,从多个分类模型中选取多个目标分类模型;基于用户数据中的测试数据集,确定多个融合模型中的每个融合模型区分正常用户和异常用户的第二准确度,其中,多个融合模型是通过多种融合方法将多个目标分类模型进行融合而获得的;基于第二准确度,从多个融合模型中选取目标融合模型,将目标融合模型确定为异常用户的识别模型。

4、在一些实施例中,基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度包括:确定用户数据中的训练数据集的训练特征,其中,训练特征用于反映用户的行为特点;基于训练特征,通过多个分类模型中的每个分类模型对训练数据集进行分类、并确定每个分类模型对应的分类结果的准确度,将分类结果的准确度记作第一准确度。

5、在一些实施例中,确定用户数据中的训练数据集的训练特征包括:利用特征提取模型、并基于训练数据集中的正样本和负样本的行为差异确定训练数据集的第一训练特征,其中,正样本对应于正常用户,负样本对应于异常用户;对第一训练特征进行特征消融实验,确定第二训练特征;对第二训练特征进行筛选,确定第三训练特征,将第三训练特征确定为训练数据集的训练特征。

6、在一些实施例中,利用特征提取模型、并基于训练数据集中的正样本和负样本的差异确定训练数据集的第一训练特征包括:利用多种特征提取模型中的每种特征提取模型获取训练数据集的提取特征;基于每种特征提取模型获取的提取特征,利用分类模型对训练数据集进行分类、并确定每种特征提取模型对应的分类结果的第三准确度;基于第三准确度,选取多种特征提取模型中的一种或多种特征提取模型获取的提取特征作为训练数据集的提取特征,其中,第一训练特征包括提取特征;基于训练数据集中的正样本和负样本的差异获取训练数据集的构建特征,其中,第一训练特征包括构建特征。

7、在一些实施例中,对第二训练特征进行筛选,确定第三训练特征包括:利用过滤法对第二训练特征进行第一次筛选;基于树模型对经过第一次筛选的第二训练特征进行第二次筛选;将经过第二次筛选的第二训练特征确定为第三训练特征。

8、在一些实施例中,基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度还包括:在确定训练数据集的训练特征后,对训练数据集进行正样本和负样本的平衡处理、并将平衡处理后的数据集更新为训练数据集。

9、在一些实施例中,对训练数据集进行正样本和负样本的平衡处理包括:通过多种样本平衡方法对训练数据集进行平衡处理,其中,多种样本平衡方法包括一种或多种过采样方法和一种或多种负采样方法;对于通过多种样本平衡方法中的每种样本平衡方法进行平衡处理后获得的数据集,通过分类模型对数据集进行分类、并确定每种平衡方法对应的第四准确度;基于第四准确度从多种样本平衡方法中选取实际样本平衡方法,并将通过实际样本平衡方法进行平衡处理后获得的数据集确定为训练数据集。

10、在一些实施例中,基于用户数据中的测试数据集,确定多个融合模型中的每个融合模型区分正常用户和异常用户的第二准确度包括:确定用户数据中的测试数据集的测试特征,其中,测试特征与训练数据集的训练特征相同;基于测试特征,通过多个融合模型中的每个融合模型对测试数据集进行分类、并确定每个融合模型对应的分类结果的准确度,将分类结果的准确度记作第二准确度。

11、在一些实施例中,上述确定方法还包括:在将所述多个目标分类模型进行融合之前,利用贝叶斯优化对所述多个目标分类模型中的每个目标分类模型进行超参数搜索。

12、在一些实施例中,上述确定方法还包括:获取原始用户数据;对原始用户数据进行预处理,获得用户数据,其中,预处理包括异常值处理、缺失值处理、数据标准化、数据归一化中的至少一项。

13、在一些实施例中,上述确定方法还包括:获取待识别用户数据;利用识别模型从待识别用户数据中识别出异常用户。

14、在一些实施例中,利用识别模型从待识别用户数据中识别出异常用户包括:确定待识别用户数据的特征,其中,特征与测试数据集的测试特征相同;基于特征、识别模型,从待识别用户数据中识别出异常用户。

15、根据本公开的另一些实施例,提供了一种异常用户的识别模型的确定装置,包括:第一确定模块,被配置为基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度;第一选取模块,被配置为基于第一准确度,从多个分类模型中选取多个目标分类模型;第二确定模块,被配置为基于用户数据中的测试数据集,确定多个融合模型中的每个融合模型区分正常用户和异常用户的第二准确度,其中,多个融合模型是通过多种融合方法将多个目标分类模型进行融合而获得的;第二选取模块,被配置为基于第二准确度,从多个融合模型中选取目标融合模型,将目标融合模型确定为异常用户的识别模型。

16、根据本公开的又一些实施例,提供了一种异常用户的识别模型的确定装置,包括:处理器;以及耦接至处理器的存储器,用于存储指令,指令被处理器执行时,使处理器执行如前所述的异常用户的识别模型的确定方法。

17、根据本公开的再一些实施例,提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如前所述的异常用户的识别模型的确定方法。

18、根据本公开的还一些实施例,提供了一种计算机程序产品,包括指令,指令当由处理器执行时使处理器执行如前所述的异常用户的识别模型的确定方法。

19、本公开基于用户数据中的训练数据集从多个分类模型中选取第一准确度较高的多个目标分类模型,基于用户数据中的测试数据集从利用多种融合方法对多个目标分类模型进行融合而获得的多个融合模型中,选取第二准确度最高的目标融合模型,并将其确定为异常用户的识别模型。本公开的识别模型从选取多种目标分类模型到对多种目标分类模型进行融合都基于准确度进行了筛选,能够提高识别异常用户的准确性,因此将本公开的识别本文档来自技高网...

【技术保护点】

1.一种异常用户的识别模型的确定方法,包括:

2.根据权利要求1所述的确定方法,其中,所述基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度包括:

3.根据权利要求2所述的确定方法,其中,所述确定用户数据中的训练数据集的训练特征包括:

4.根据权利要求3所述的确定方法,其中,所述利用特征提取模型、并基于训练数据集中的正样本和负样本的差异确定所述训练数据集的第一训练特征包括:

5.根据权利要求3所述的确定方法,其中,所述对所述第二训练特征进行筛选,确定第三训练特征包括:

6.根据权利要求2所述的确定方法,其中,所述基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度还包括:

7.根据权利要求6所述的确定方法,其中,所述对所述训练数据集进行正样本和负样本的平衡处理包括:

8.根据权利要求1所述的确定方法,其中,所述基于所述用户数据中的测试数据集,确定多个融合模型中的每个融合模型区分正常用户和异常用户的第二准确度包括:

9.根据权利要求1所述的确定方法,还包括:

10.根据权利要求1所述的确定方法,还包括:

11.根据权利要求1所述的确定方法,还包括:

12.根据权利要求11所述的确定方法,其中,所述利用所述识别模型从所述待识别用户数据中识别出异常用户包括:

13.一种异常用户的识别模型的确定装置,包括:

14.一种异常用户的识别模型的确定装置,包括:

15.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现权利要求1至12中任一项所述的异常用户的识别模型的确定方法。

16.一种计算机程序产品,包括指令,所述指令当由处理器执行时使所述处理器执行根据权利要求1至12中任一项所述的异常用户的识别模型的确定方法。

...

【技术特征摘要】

1.一种异常用户的识别模型的确定方法,包括:

2.根据权利要求1所述的确定方法,其中,所述基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度包括:

3.根据权利要求2所述的确定方法,其中,所述确定用户数据中的训练数据集的训练特征包括:

4.根据权利要求3所述的确定方法,其中,所述利用特征提取模型、并基于训练数据集中的正样本和负样本的差异确定所述训练数据集的第一训练特征包括:

5.根据权利要求3所述的确定方法,其中,所述对所述第二训练特征进行筛选,确定第三训练特征包括:

6.根据权利要求2所述的确定方法,其中,所述基于用户数据中的训练数据集,确定多个分类模型中的每个分类模型区分正常用户和异常用户的第一准确度还包括:

7.根据权利要求6所述的确定方法,其中,所述对所述训练数据集进行正样本和负样本的平衡处理包括:

8.根据权利...

【专利技术属性】
技术研发人员:顾茜项冰洁韩晓樱黄响徐永嘉师育起林郁吴雄劲赖彬彬
申请(专利权)人:福建中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1