【技术实现步骤摘要】
异常数据的检测方法、装置、计算机设备及存储介质
[0001]本申请涉及数据安全
,特别是涉及一种异常数据的检测方法
、
装置
、
计算机设备
、
存储介质和计算机程序产品
。
技术介绍
[0002]目前,针对网络数据的异常检测方法通常是将网络流量数据输入至异常检测模型中,通过异常检测模型判断输入的网络流量数据是否存在异常
。
[0003]在当前的异常检测模型中,通过识别网络流量数据中具有显著差异的数据点来判断数据是否为异常数据
。
由于异常检测的目标数据包含很多特征,因此采用数据降维的方法来实现特征的分离,但是基于降维后的特征进行检测的方法会舍弃掉表现不显著的非显著特征,从而丢失可能存在异常的非显著特征,降低判断数据异常的准确性
。
[0004]因此,在确定网络流量数据是否异常时,如何将网络流量数据的全部特征进行异常判断,提高判断异常数据的准确性,是亟待解决的技术问题
。
技术实现思路
[00 ...
【技术保护点】
【技术特征摘要】
1.
一种异常数据的检测方法,其特征在于,所述方法包括:获取网络流量数据,作为待检测数据,将所述待检测数据映射到低维度特征空间,得到所述待检测数据对应的多个低维度数据点;针对于每个低维度数据点,确定所述低维度数据点在所述低维度特征空间的特征空间异常程度值,并确定所述低维度数据点在还原至降维前的高维度特征空间过程中存在的数据恢复异常程度值;根据所述特征空间异常程度值和所述数据恢复异常程度值,确定所述低维度数据点的目标异常值,并基于所述目标异常值确定所述低维度数据点对应的待检测数据是否为异常数据
。2.
根据权利要求1所述的方法,其特征在于,所述确定所述低维度数据点在所述低维度特征空间的特征空间异常程度值,包括:基于预设的核密度函数,确定所述低维度数据点在所述低维度特征空间的概率密度值;基于所述概率密度值的倒数,确定所述低维度数据点在所述低维度特征空间的初始异常程度值;基于所述初始异常程度值与参考异常程度值,得到所述低维度数据点的特征空间异常程度值;其中,所述参考异常程度值是基于所述多个低维度数据点的初始异常程度值确定的
。3.
根据权利要求2所述的方法,其特征在于,所述基于所述初始异常程度值与参考异常程度值,得到所述低维度数据点的特征空间异常程度值,包括:从所述多个低维度数据点的初始异常程度值中,确定出最大的初始异常程度值,作为所述参考异常程度值;针对每个低维度数据点,将所述低维度数据点的初始异常程度值与所述参考异常程度值求商,得到所述低维度数据点的特征空间异常程度值
。4.
根据权利要求1所述的方法,其特征在于,所述确定所述低维度数据点在还原至降维前的高维度特征空间过程中存在的数据恢复异常程度值,包括:将所述低维度数据点还原至降维前的高维度特征空间,得到所述低维度数据点对应的还原数据;确定所述还原数据与原始数据之间的误差距离值,并基于所述误差距离值和参考距离值,得到所述低维度数据点的数据恢复异常程度值;其中,所述原始数据是所述低维度数据点在降维前的数据;所述参考距离值是基于所述多个低维度数据点的误差距离值确定的
。5.
根据权利要求4所述的方法,其特征在于,所述基于所述误差距离值和参考距离值,得到所述低维度数据点的数据恢复异常程度值,包括:从所述多个低维度数据点的误差距离值中,确定出最大的误差距离值,作为所述参考距离值;针对每个低维度数据点,将所述低维度数据点的误差距离值与所述参考距离值求商,得到所述低维度数据点的数据恢复异常程度值
。6.
根据权利要求1所述的方法,其特征在于,所述根据所述特征空间异常程度值和所述数据恢复异常程度值,确定所述低维度数据点的目标异常值,包括:
获取所述特征空间异常程度值和所述数据恢复异常程度值各自对应的权重值;基于所述权重值,对所述特征空间异常程度值和所述数据恢复异常程度值进行加权计算,得到所述低维度数据点的目标异常值
。7....
【专利技术属性】
技术研发人员:高文杰,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。