【技术实现步骤摘要】
时间序列异常检测的变分自编码器的超参数自动调优方法
[0001]本专利技术涉及大数据处理领域,尤其涉及一种基于多维索引的海量时空数据可视化性能优化方法及系统。
技术介绍
[0002]为了保证应用程序的可靠性,大型互联网公司监控着成千上万的KPI,如请求响应时间、内存的使用率、CPU的利用率等,以及时发现程序故障并排除,KPI通常是时间序列数据,其格式为(时间,值)。
[0003]变分自编码器通常用来学习数据的分布,并且被广泛应用于季节性的时间序列数据的异常检测,变分自编码器算法包含十多个超参数,这些超参数影响着变分自编码器的性能,现有的变分自编码器算法只能应用在特定的KPI上,当应用到新的KPI上时,需要重新设置其超参数,但是,在成千上万的超参数组合下,寻找最优的组合需要消耗巨大的人力和物力,并且准确率都不高。
技术实现思路
[0004]本专利技术的目的在于解决
技术介绍
中的至少一个技术问题,为实现上述目的,本专利技术提供一种时间序列异常检测的变分自编码器的超参数自动调优方法,包括:
[0005 ...
【技术保护点】
【技术特征摘要】
1.时间序列异常检测的变分自编码器的超参数自动调优方法,其特征在于,包括:获取超参数空间,进行参数配置,对所述超参数空间进行等概率划分后进行抽样,根据抽样结果得到超参数组合;获取时间序列数据并对其进行预处理,将预处理后的所述时间序列数据转化为变分自编码器的输入数据,划分所述输入数据,得到测试集合和训练集合;采用贝叶斯网络模型,对所述训练集合进行重构,得到训练数据,根据所述训练数据训练优化所述贝叶斯网络模型,得到参数自动调优模型;使用所述测试集合对所述参数自动调优模型进行测试,对每个所述测试集合进行异常检测并判断区域属性。2.根据权利要求1所述的时间序列异常检测的变分自编码器的超参数自动调优方法,其特征在于,所述对所述超参数空间进行等概率划分后进行抽样的方法为:对所述超参数空间进行等概率划分,得到n个区间,从每个所述区间中随机抽样一个随机数,打乱所述随机数的顺序后,得到抽样样本,计算每个所述抽样样本的距离,选取距离最大的所述抽样样本做为所述抽样结果,根据所述抽样结果得到所述超参数组合。3.根据权利要求2所述的时间序列异常检测的变分自编码器的超参数自动调优方法,其特征在于,所述对所述超参数空间进行等概率划分后进行抽样的公式为:征在于,所述对所述超参数空间进行等概率划分后进行抽样的公式为:其中,n为所述区间的个数;a为所述区间的上界;b为所述区间的下界;a
i
为第i个所述时间序列数据的区间的上界;b
i
为第i个所述时间序列数据的区间的下界。4.根据权利要求3所述的时间序列异常检测的变分自编码器的超参数自动调优方法,其特征在于,所述获取时间序列数据并对其进行预处理的方法为:使用NULL对所述时间序列数据填补缺失数据,将所述时间序列数据转化为固定时间间隔的数据格式,所述固定时间间隔为1分钟,对所述时间序列数据进行标准化处理。5.根据权利要求4所述的时间序列异常检测的变分自编码器的超参数自动调优方法,其特征在于,所述获取时间序列数据并对其进行预处理的公式为:其中,Xmax为所述时间序列数据的最大值;Xmin为所述时间序列数据的最小值;Xi,t为第i个所述时间序列数据在时刻t被标准化;为在时刻t被标准化后的第i个所述时间序列数据。
6.根据权利要求5所述的时间序列异常检测的变分自编码器的超参数自动调优方法,其特征在于,所述划分所述输入数据方法为:使用滑动窗口技术将所述时间序列数据转化为所述变分自编码器的所述输入数据,将所述输入数据根据预设阈值进行划分,得到所述测试集合和所述训练集合,所述训练集合和所述测试集合的比例为7:3。7.根据权利要求6所述的时间序列异常检测的变分自编码器的超参数自动调优方法,其特征在于,所述采用贝叶斯网络模型的公式为:P(x)=∫p(z)p(x|z)dz=∫q(z|x)p(z)p(x|z)dz;其中,q(z|x)为编/解码器的层数;p(x|z)为神经元数;z为所述超参数组合的维度;P(z)为先验...
【专利技术属性】
技术研发人员:李晖,孙武,
申请(专利权)人:贵州优联博睿科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。