一种异常对象检测方法及装置、电子设备及存储介质制造方法及图纸

技术编号:30437796 阅读:16 留言:0更新日期:2021-10-24 17:41
本申请涉及一种异常对象检测方法及装置、电子设备及存储介质,其中,方法包括:对多个候选对象进行聚类,得到对象集群;根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度;在所述至少一个聚集特征维度包含异常特征维度组合的情况下,将所述对象集群确定为异常集群。本申请能够根据对象集群在不同维度的目标特征维度上的聚集程度,确定出导致聚集的聚集特征维度,并且能够通过判断聚集特征维度是否包括异常特征维度组合判断对象集群是否存在异常,同时,还可以将异常特征维度组合中的特征作为该异常集群的解释,进而,进而使异常检测的原理透明可理解。透明可理解。透明可理解。

【技术实现步骤摘要】
一种异常对象检测方法及装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种异常对象检测方法及装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,越来越多的线上行为也需要进行异常检测,例如,风控场景中异常检测主要面临两个问题:聚集性异常和可解释性。
[0003]聚集性异常很重要的特点是,单独分析某一条样本都显得很正常,而呈批量现象出现后则很异常。一个典型的例子就是“信用卡欺诈检测”,例如:单笔75元的消费很正常,但是每天短时间内连续两笔75元购买同一商品的消费就显得较为异常。
[0004]可解释性即检测算法能够对聚集性异常的检测结果给出合理可靠的解释。现有的基于人工规则的做法,可解释性强,但是不够灵活人力成本高,对于聚集性异常的识别能力也较弱。后续基于有监督机器学习算法的模型,可解释性较差且对于异常样本的依赖性较高,此外即便模型能够学习到样本中的模式,但对于未出现在样本集中的模型则难以识别。
[0005]由上可知,相关技术中的异常对象检测方法存在可解释性差且识别效果差的问题。

技术实现思路

[0006]为了解决上述异常对象检测方法存在的可解释性差且识别效果差的技术问题,本申请提供了一种异常对象检测方法及装置、电子设备及存储介质。
[0007]第一方面,本申请实施例提供了一种异常对象检测方法,包括:
[0008]对多个候选对象进行聚类,得到对象集群,其中,所述对象集群中包括所述多个候选对象中的至少两个目标对象;
[0009]根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度;
[0010]在所述至少一个聚集特征维度包含异常特征维度组合的情况下,将所述对象集群确定为异常集群,其中,所述异常特征维度组合为用于指示任一所述对象集群在异常特征维度组合中的每个异常特征维度上的聚集程度均满足预设聚集要求时,所述对象集群为异常的维度组合。
[0011]可选地,如前述的方法,所述对多个候选对象进行聚类,得到对象集群包括:
[0012]根据第一行为特征对所述多个候选对象进行聚类,得到所述对象集群,其中,所述第一行为特征包含所述多个候选对象中的每个候选对象在多个维度上的行为特征。
[0013]可选地,如前述的方法,所述根据第一行为特征对所述多个候选对象进行聚类,得到所述对象集群包括:
[0014]对所述第一行为特征进行降维处理,得到第二行为特征,其中,所述第二行为特征中的每个维度上的行为特征通过所述第一行为特征中的至少一个维度上的行为特征映射
得到;
[0015]基于所述第二行为特征,对所述多个候选对象进行聚类,得到所述对象集群。
[0016]可选地,如前述的方法,在所述根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度之前,所述方法还包括:
[0017]按照目标离散化行为特征对所述第一行为特征中每个维度的行为特征进行离散化处理,得到第三行为特征,其中,所述多个目标特征维度包含所述目标离散化行为特征维度和目标属性特征维度,所述目标属性特征维度是从所述多个候选对象的候选属性特征维度中提取出的属性特征维度。
[0018]可选地,如前述的方法,所述根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度包括:
[0019]对所述至少两个目标对象的所述每个目标特征维度进行基尼系数计算,得到所述至少两个目标对象在所述每个目标特征维度上的聚集程度;
[0020]从所述多个目标特征维度中选择出对应的所述聚集程度大于或等于预设聚集程度阈值的特征维度,得到所述至少一个聚集特征维度。
[0021]可选地,如前述的方法,所述根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度之前,所述方法还包括至少以下之一:
[0022]获取输入的所述异常特征维度组合;
[0023]按照所述多个候选对象中的每个候选对象在所述每个目标特征维度上的特征值的目标特征属性,从所述多个目标特征维度中选择出至少一个特征维度,得到所述异常特征维度组合,其中,所述目标特征属性为以下至少之一:重复概率,分散程度。
[0024]可选地,如前述的方法,在所述根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度之后,所述方法还包括:
[0025]使用所述异常特征维度组合中的每个异常特征维度在所述至少一个聚集特征维度中进行匹配,得到所述每个异常特征维度的目标匹配结果,其中,所述目标匹配结果用于指示所述至少一个聚集特征维度中是否包含所述每个异常特征维度。
[0026]第二方面,本申请实施例提供了一种异常对象检测装置,包括:
[0027]对象集群模块,用于对多个候选对象进行聚类,得到对象集群,其中,所述对象集群中包括所述多个候选对象中的至少两个目标对象;
[0028]聚集特征维度模块,用于根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度;
[0029]确定模块,用于在所述至少一个聚集特征维度包含异常特征维度组合的情况下,将所述对象集群确定为异常集群,其中,所述异常特征维度组合为用于指示任一所述对象集群在异常特征维度组合中的每个异常特征维度上的聚集程度均满足预设聚集要求时,所述对象集群为异常的维度组合。
[0030]第三方面,本申请实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,所述处理器、通信接口和存储器通过通信总线完成相互间的通信;
[0031]所述存储器,用于存放计算机程序;
[0032]所述处理器,用于执行所述计算机程序时,实现如前述任一项所述的方法。
[0033]第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行如前任一项所述的方法。
[0034]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:在聚类的基础上,根据对象集群在不同维度的目标特征维度上的聚集程度,确定出聚集特征维度,并且能够通过判断聚集特征维度是否包括异常特征维度组合判断对象集群是否存在异常,进一步的,在异常特征维度组合为可解释对象集群聚集的原因的基础上,可以将异常特征维度组合中的特征作为该异常集群的解释;进而,能够在有效识别异常集群的同时,给出该异常集群的异常原因,进而使检测的原理透明可理解。
附图说明
[0035]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常对象检测方法,其特征在于,包括:对多个候选对象进行聚类,得到对象集群,其中,所述对象集群中包括所述多个候选对象中的至少两个目标对象;根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度;在所述至少一个聚集特征维度包含异常特征维度组合的情况下,将所述对象集群确定为异常集群,其中,所述异常特征维度组合为用于指示任一所述对象集群在异常特征维度组合中的每个异常特征维度上的聚集程度均满足预设聚集要求时,所述对象集群为异常的维度组合。2.根据权利要求1所述的方法,其特征在于,所述对多个候选对象进行聚类,得到对象集群包括:根据第一行为特征对所述多个候选对象进行聚类,得到所述对象集群,其中,所述第一行为特征包含所述多个候选对象中的每个候选对象在多个维度上的行为特征。3.根据权利要求2所述的方法,其特征在于,所述根据第一行为特征对所述多个候选对象进行聚类,得到所述对象集群包括:对所述第一行为特征进行降维处理,得到第二行为特征,其中,所述第二行为特征中的每个维度上的行为特征通过所述第一行为特征中的至少一个维度上的行为特征映射得到;基于所述第二行为特征,对所述多个候选对象进行聚类,得到所述对象集群。4.根据权利要求3所述的方法,其特征在于,在所述根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度之前,所述方法还包括:按照目标离散化行为特征对所述第一行为特征中每个维度的行为特征进行离散化处理,得到第三行为特征,其中,所述多个目标特征维度包含所述目标离散化行为特征维度和目标属性特征维度,所述目标属性特征维度是从所述多个候选对象的候选属性特征维度中提取出的属性特征维度。5.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个目标对象在多个目标特征维度中的每个目标特征维度上的聚集程度,从所述多个目标特征维度中确定出至少一个聚集特征维度包括:对所述至少两个目标对象的所述每个目标特征维度进行基尼系数计算,得到所述至少两个目标对象在所述每个目标特征维度上的聚集程度;从所述多个目标特征维度中选择出对应的所述聚集程度大于或等于预设聚...

【专利技术属性】
技术研发人员:补彬
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1