一种时间序列的标记方法、装置、设备和存储介质制造方法及图纸

技术编号:21089665 阅读:32 留言:0更新日期:2019-05-11 09:59
本发明专利技术公开了一种时间序列的检测方法、装置、设备和存储介质。其中,该方法包括:获取时间序列中的序列点;通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果;如果第一确定结果与第二确定结果一致,则将确定为正常点的序列点作为正常样本,将确定为异常点的序列点作为异常样本;通过分类模型得到时间序列中各序列点的检测结果,并根据检测结果标记时间序列中的异常点。本发明专利技术实施例提供的技术方案,避免采用单一的统计模型或者无监督学习模型对时间序列中的序列点进行检测时所存在的漏检和误检的问题,提高时间序列中异常点标记的准确性和可靠性。

【技术实现步骤摘要】
一种时间序列的标记方法、装置、设备和存储介质
本专利技术实施例涉及互联网
,尤其涉及一种时间序列的标记方法、装置、设备和存储介质。
技术介绍
时间序列是指某一应用场景下针对特定指标得到的基于与时间顺序相关联的有序观测数据集,随着互联网技术的快速发展,需要对各项指标对应的时间序列数据进行预测分析,从而判断时间序列中是否存在异常的指标。现有时间序列中的异常标记,大多是由工程师手动检测标记,或者通过一种线性回归模型对时间序列进行异常检测,从而标记对应的异常点,但是要求工程师具备对应的该时间序列所处应用场景的业务背景,且需要检测标注的序列数据量较大,会耗费大量人力成本;同时线性回归模型存在一定的局限性且实时性较低,得到时间序列的异常标记结果的可靠性不强。
技术实现思路
本专利技术实施例提供了一种时间序列的标记方法、装置、设备和存储介质,以实现时间序列的异常标记,提高异常标记结果的准确性和可靠性。第一方面,本专利技术实施例提供了一种时间序列的标记方法,该方法包括:获取时间序列中的序列点;通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果;如果所述第一确定结果与所述第二确定结果一致,则将确定为正常点的序列点作为正常样本,将确定为异常点的序列点作为异常样本;通过分类模型得到所述时间序列中各序列点的检测结果,并根据所述检测结果标记所述时间序列中的异常点,所述分类模型通过所述异常样本和下采样后的正常样本训练得到。进一步的,所述通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,包括:所述统计模型包括两个或两个以上的统计子模型,则通过所述统计子模型分别得到序列点是否为异常点的初始检测结果;如果所述初始检测结果均为该序列点为正常点,则得到该序列点为正常点的第一确定结果;如果序列点为异常点的初始检测结果数量大于等于预设统计阈值,则得到该序列点为异常点的第一确定结果,所述预设统计阈值由所述统计子模型的数量确定。进一步的,所述通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果,包括:所述无监督学习模型的数量为一个,通过所述无监督学习模型得到序列点是否为异常点的初始检测结果作为所述第二确定结果。进一步的,所述通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果,包括:所述无监督学习模型包括两个或两个以上的无监督学习子模型,通过所述无监督学习子模型分别得到序列点是否为异常点的初始检测结果;如果所述初始检测结果均为该序列点为正常点,则得到该序列点为正常点的第二确定结果;如果该序列点为异常点的初始检测结果数量大于等于预设无监督阈值,则得到该序列点为异常点的第二确定结果,所述预设无监督阈值由所述无监督学习子模型的数量确定。进一步的,所述通过分类模型得到所述时间序列中各序列点的检测结果,包括:将所述时间序列中的各序列点输入所述分类模型中,得到所述序列点的异常概率;按照所述异常概率对各序列点进行排序,并采用Top算法在排序后的序列点中确定目标序列点,将所述目标序列点的异常概率作为所述分类模型的分类阈值;根据所述序列点的异常概率和所述分类阈值,确定所述时间序列中各序列点是否为异常点的检测结果。第二方面,本专利技术实施例提供了一种时间序列的标记装置,该装置包括:序列点获取模块,用于获取时间序列中的序列点;确定结果获取模块,用于通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果;样本确定模块,用于如果所述第一确定结果与所述第二确定结果一致,则将确定为正常点的序列点作为正常样本,将确定为异常点的序列点作为异常样本;异常点标记模块,用于通过分类模型得到所述时间序列中各序列点的检测结果,并根据所述检测结果标记所述时间序列中的异常点,所述分类模型通过所述异常样本和下采样后的正常样本训练得到。进一步的,所述确定结果获取模块,包括:统计结果获取单元,用于所述统计模型的数量为一个,通过所述统计模型得到序列点是否为异常点的初始检测结果作为所述第一确定结果。进一步的,所述统计结果获取单元,具体用于:所述统计模型包括两个或两个以上的统计子模型,则通过所述统计子模型分别得到序列点是否为异常点的初始检测结果;如果所述初始检测结果均为该序列点为正常点,则得到该序列点为正常点的第一确定结果;如果序列点为异常点的初始检测结果数量大于等于预设统计阈值,则得到该序列点为异常点的第一确定结果,所述预设统计阈值由所述统计子模型的数量确定。进一步的,所述确定结果获取模块,包括:无监督结果获取单元,用于所述无监督学习模型的数量为一个,通过所述无监督学习模型得到序列点是否为异常点的初始检测结果作为所述第二确定结果。进一步的,所述无监督结果获取单元,具体用于:所述无监督学习模型包括两个或两个以上的无监督学习子模型,通过所述无监督学习子模型分别得到序列点是否为异常点的初始检测结果;如果所述初始检测结果均为该序列点为正常点,则得到该序列点为正常点的第二确定结果;如果该序列点为异常点的初始检测结果数量大于等于预设无监督阈值,则得到该序列点为异常点的第二确定结果,所述预设无监督阈值由所述无监督学习子模型的数量确定。进一步的,所述异常点标记模块,包括:异常概率获取单元,用于将所述时间序列中的各序列点输入所述分类模型中,得到所述序列点的异常概率;分类阈值确定单元,用于按照所述异常概率对各序列点进行排序,并采用Top算法在排序后的序列点中确定目标序列点,将所述目标序列点的异常概率作为所述分类模型的分类阈值;检测结果确定单元,用于根据所述序列点的异常概率和所述分类阈值,确定所述时间序列中各序列点是否为异常点的检测结果。第三方面,本专利技术实施例提供了一种设备,该设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所述的时间序列的标记方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所述的时间序列的标记方法。本专利技术实施例提供了一种时间序列的标记方法、装置、设备和存储介质,分别通过预先构建的统计模型和无监督学习模型对时间序列中的序列点是否为异常点进行初始检测,避免在仅采用单一的统计模型或者无监督学习模型对时间序列等中的序列点进行检测时所存在的漏检和误检的问题,提高时间序列中序列点的异常检测准确性,将通过统计模型和无监督学习模型均确定为正常点的序列点作为正常样本,将通过统计模型和无监督学习模型均确定为异常点的序列点作为异常样本,进而根据该异常样本和下采样的正常样本对分类模型进行训练,提高了分类模型的分类准确性,后续根据该分类模型对时间序列中的各序列点进行再次检测,以根据检测结果准确标记出时间序列中的异常点,解决了现有技术中人工检测耗费大量人力成本,以及线性回归模型存在一定的局限性且实时性较低的问题,提高了时间序列异常标记结果的准确性和可靠性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术实施例一提本文档来自技高网...

【技术保护点】
1.一种时间序列的标记方法,其特征在于,包括:获取时间序列中的序列点;通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果;如果所述第一确定结果与所述第二确定结果一致,则将确定为正常点的序列点作为正常样本,将确定为异常点的序列点作为异常样本;通过分类模型得到所述时间序列中各序列点的检测结果,并根据所述检测结果标记所述时间序列中的异常点,所述分类模型通过所述异常样本和下采样后的正常样本训练得到。

【技术特征摘要】
1.一种时间序列的标记方法,其特征在于,包括:获取时间序列中的序列点;通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果;如果所述第一确定结果与所述第二确定结果一致,则将确定为正常点的序列点作为正常样本,将确定为异常点的序列点作为异常样本;通过分类模型得到所述时间序列中各序列点的检测结果,并根据所述检测结果标记所述时间序列中的异常点,所述分类模型通过所述异常样本和下采样后的正常样本训练得到。2.根据权利要求1所述的方法,其特征在于,所述通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,包括:所述统计模型的数量为一个,通过所述统计模型得到序列点是否为异常点的初始检测结果作为所述第一确定结果。3.根据权利要求1所述的方法,其特征在于,所述通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,包括:所述统计模型包括两个或两个以上的统计子模型,则通过所述统计子模型分别得到序列点是否为异常点的初始检测结果;如果所述初始检测结果均为该序列点为正常点,则得到该序列点为正常点的第一确定结果;如果序列点为异常点的初始检测结果数量大于等于预设统计阈值,则得到该序列点为异常点的第一确定结果,所述预设统计阈值由所述统计子模型的数量确定。4.根据权利要求1所述的方法,其特征在于,所述通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果,包括:所述无监督学习模型的数量为一个,通过所述无监督学习模型得到序列点是否为异常点的初始检测结果作为所述第二确定结果。5.根据权利要求1所述的方法,其特征在于,所述通过预先构建的无监督学习模型得到序列点是否为异常点的第二确定结果,包括:所述无监督学习模型包括两个或两个以上的无监督学习子模型,通过所述无监督学习子模型分别得到序列点是否为异常点的初始检测结果;如果所述初始检测结果均为该序列点为正常点,则得到该序列点为正常点的第二确定结果;如果该序列点为异常点的初始检测结果数量大于等于预设无监督阈值,则得到该序列点为异常点的第二确定结果,所述预设无监督阈值由所述无监督学习子模型的数量确定。6.根据权利要求1所述的方法,其特征在于,所述通过分类模型得到所述时间序列中各序列点的检测结果,包括:将所述时间序列中的各序列点输入所述分类模型中,得到所述序列点的异常概率;按照所述异常概率对各序列点进行排序,并采用Top算法在排序后的序列点中确定目标序列点,将所述目标序列点的异常概率作为所述分类模型的分类阈值;根据所述序列点的异常概率和所述分类阈值,确定所述时间序列中各序列点是否为异常点的检测结果。7.一种时间序列的标记装置,其特征在于,包括:序列点获取模块,用于获取时间序列中的序列点;确定结果获取模块,用于通过预先构建的统计模型得到序列点是否为异常点的第一确定结果,通...

【专利技术属性】
技术研发人员:战泓升龚诚张昕
申请(专利权)人:北京城市网邻信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1