一种云数据中心的异常数据检测方法、装置、设备及介质制造方法及图纸

技术编号:37852281 阅读:27 留言:0更新日期:2023-06-14 22:43
本发明专利技术公开了一种云数据中心的异常数据检测方法、装置、设备及介质,用于解决现有的模糊聚类算法异常检测的准确率较低的技术问题。本发明专利技术包括:对云数据中心的数据进行预处理,得到预处理数据;以预处理数据作为蝙蝠种群,计算蝙蝠种群的平均位距;获取蝙蝠种群的初始参数;根据平均位距和初始参数计算蝙蝠种群的局部最优解;根据局部最优解确定初始化聚类数和聚类中心;根据初始化聚类数和聚类中心对蝙蝠种群进行聚类,得到聚类结果;当当前聚类次数小于预设聚类迭代次数时,返回计算蝙蝠种群的平均位距的步骤;当当前聚类次数等于预设聚类迭代次数时,将聚类结果作为目标聚类结果;根据目标聚类结果确定云数据中心的异常数据。根据目标聚类结果确定云数据中心的异常数据。根据目标聚类结果确定云数据中心的异常数据。

【技术实现步骤摘要】
一种云数据中心的异常数据检测方法、装置、设备及介质


[0001]本专利技术涉及数据检测
,尤其涉及一种云数据中心的异常数据检测方法、装置、设备及介质。

技术介绍

[0002]随着云计算逐渐发展成为信息社会的公共资源,作为支撑云计算服务的基础设施的云数据中心也逐渐为大家熟知。云数据中心具有高度虚拟化、自动化管理和绿色节能的特点,这些特点使它受到了各大行业,特别是需要大量存储计算需求的行业的青睐。然而,更大数据量的存储和计算必然会带来更多的异常数据,如何准确高效地发现云数据中心中的数据的异常已成为云计算领域中亟待解决的问题。
[0003]异常检测是数据挖掘中的热门领域,现有的异常检测算法可大致分为无监督和有监督两种。有监督算法很大程度上依赖于事先分类好的带标签的数据,比如神经网络算法、k

近邻算法、决策树算法和朴素贝叶斯算法。这些算法均表现出了很高的检测准确率,但是假如用于训练的数据集存在特殊性或标签不正确,则会导致模型出现偏差甚至错误。而且在实际应用中,很难获得大量准确的带标签数据。因此,无监督算法由于其无需带标本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种云数据中心的异常数据检测方法,其特征在于,包括:对所述云数据中心的数据进行预处理,得到预处理数据;以所述预处理数据作为蝙蝠种群,计算所述蝙蝠种群的平均位距;获取所述蝙蝠种群的初始参数;根据所述平均位距和所述初始参数计算所述蝙蝠种群的局部最优解;根据所述局部最优解确定初始化聚类数和聚类中心;根据所述初始化聚类数和所述聚类中心对所述蝙蝠种群进行聚类,得到聚类结果;当所述当前聚类次数小于预设聚类迭代次数时,返回计算所述蝙蝠种群的平均位距的步骤;当所述当前聚类次数等于预设聚类迭代次数时,将所述聚类结果作为目标聚类结果;根据所述目标聚类结果确定所述云数据中心的异常数据。2.根据权利要求1所述的方法,其特征在于,所述对所述云数据中心的数据进行预处理,得到预处理数据的步骤,包括:对所述云数据中心的数据进行数据标准化,得到标准化数据;对所述标准化数据进行数据补全,得到预处理数据。3.根据权利要求1所述的方法,其特征在于,所述计算所述蝙蝠种群的平均位距的步骤,包括:获取所述蝙蝠种群的种群规模;将所述蝙蝠种群所在的空间切割为多个种群子空间,并统计每个所述种群子空间内的蝙蝠数量;采用每个所述种群子空间内的蝙蝠数量和所述种群规模计算所述蝙蝠种群的分布熵;采用所述分布熵计算所述蝙蝠种群的平均位距。4.根据权利要求3所述的方法,其特征在于,所述采用所述分布熵计算所述蝙蝠种群的平均位距的步骤,包括:获取每个所述蝙蝠种群所在的空间的长度;获取与所述分布熵数值对应的多个维度空间;确定所述蝙蝠种群中每个蝙蝠在各个所述维度空间的维度坐标,以及每个所述维度空间中所述蝙蝠的平均坐标;采用所述蝙蝠种群所在的空间的长度、所述分布熵、所述维度坐标、所述平均坐标和所述种群规模,计算所述蝙蝠种群的平均位距。5.根据权利要求1所述的方法,其特征在于,所述初始参数包括初始速度、初始位置和自适应频率;所述根据所述平均位距和所述初始参数计算所述蝙蝠种群的局部最优解的步骤,包括:获取控制阈值和初始惯性权重;根据所述控制阈值、所述初始惯性权重和所述平均位距计算当前惯性权重;采用所述当前惯性权重计算、所述自适应频率和所述初始速度计算更新速度;根据更新速度和所述初始位置计算更新位置;判断所述当前迭代次数是否小于预设迭代次数阈值;若是,将当前迭代次数加1,以所述更新位...

【专利技术属性】
技术研发人员:苏善婷顾心磊王晓鹏吴风蛟张继东翟镇
申请(专利权)人:天翼数字生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1