The embodiment of this specification provides an interpretation feature determination method and apparatus for anomaly detection, in which the method may include: for a sample of input anomaly detection model, the sample includes at least one sample feature, and the offset of the sample feature is determined according to the distribution parameter of each sample feature; the distribution parameter is used to represent the sample feature in the anomaly detection. Distribution characteristics in the training set data of the measurement model; the anomaly detection model is an unsupervised model; according to the offset of each sample feature in the sample, at least one sample feature is determined as the corresponding interpretation feature of the sample, which is used to explain the correlation between the sample and the output of the corresponding anomaly detection model.
【技术实现步骤摘要】
一种异常检测的解释特征确定方法和装置
本公开涉及大数据
,特别涉及一种异常检测的解释特征确定方法和装置。
技术介绍
异常检测是数据挖掘中的较为重要的一部分,可以应用于入侵检测、欺诈检测、故障检测、系统健康检测、传感器网络事件检测和生态系统干扰检测等多种领域。在实际的异常检测应用当中,其中一种算法即为无监督的异常检测模型。异常检测模型往往是一个黑盒,用户无法感知其内部工作状态,为了提高使用模型的可信度,模型解释就显得至关重要。通过对模型解释,可以进一步理解模型的输出结果,例如究竟输入样本的哪些特征对模型输出影响最大。通过模型解释能够为异常检测模型的输出结果的原因提供分析方向。
技术实现思路
有鉴于此,本说明书一个或多个实施例提供一种异常检测的解释特征确定方法和装置,以提高异常检测的解释特征获取的准确性。具体地,本说明书一个或多个实施例是通过如下技术方案实现的:第一方面,提供一种异常检测的解释特征确定方法,所述方法包括:对于输入异常检测模型的一个样本,所述样本包括至少一个样本特征,根据每个样本特征的分布参数确定所述样本特征的偏移度;所述分布参数用于表示该样本特征在所 ...
【技术保护点】
1.一种异常检测的解释特征确定方法,所述方法包括:对于输入异常检测模型的一个样本,所述样本包括至少一个样本特征,根据每个样本特征的分布参数确定所述样本特征的偏移度;所述分布参数用于表示该样本特征在所述异常检测模型的训练集数据中的分布特点;所述异常检测模型是无监督模型;根据所述样本中的各个样本特征的偏移度,确定至少一个样本特征作为所述样本对应的解释特征,所述解释特征用于解释所述样本与对应的所述异常检测模型的模型输出结果之间的关联。
【技术特征摘要】
1.一种异常检测的解释特征确定方法,所述方法包括:对于输入异常检测模型的一个样本,所述样本包括至少一个样本特征,根据每个样本特征的分布参数确定所述样本特征的偏移度;所述分布参数用于表示该样本特征在所述异常检测模型的训练集数据中的分布特点;所述异常检测模型是无监督模型;根据所述样本中的各个样本特征的偏移度,确定至少一个样本特征作为所述样本对应的解释特征,所述解释特征用于解释所述样本与对应的所述异常检测模型的模型输出结果之间的关联。2.根据权利要求1所述的方法,所述根据每个样本特征的分布参数确定所述样本特征的偏移度之前,所述方法还包括:根据所述异常检测模型的训练集数据,分别获得所述训练集数据中各个样本特征的分布参数。3.根据权利要求2所述的方法,所述分别获得所述训练集数据中各个样本特征的分布参数,包括:所述训练集数据包括多个样本,每个样本包括至少一个样本特征;由所述训练集数据的各个样本中分别获取目标样本特征,得到包括多个目标样本特征的目标特征集;根据所述目标特征集,确定所述目标样本特征的分布参数。4.根据权利要求1所述的方法,所述分布参数包括:所述样本特征的均值和方差。5.根据权利要求4所述的方法,所述根据每个样本特征的分布参数确定所述样本特征的偏移度,包括:对于所述异常检测模型的测试集数据中所述样本的其中一个样本特征,确定所述样本特征在所述样本中的实际值;获取所述样本特征在训练集数据中的均值;确定所述实际值偏离所述均值几倍方差的距离,作为所述偏移度。6.根据权利要求1所述的方法,所述根据样本中的各个样本特征的偏移度,确定至少一个样本特征作为所述样本对应的解释特征,包括:根据所述样本中的各个样本特征的偏移度,将所述各个样本特征进行降序排列,并将排序在前预设位数的所述至少一个样本特征作为所述解释特征。7.一种异常检测的...
【专利技术属性】
技术研发人员:方文静,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。