一种时间序列异常检测方法及装置制造方法及图纸

技术编号:21343426 阅读:32 留言:0更新日期:2019-06-13 22:26
本发明专利技术实施例提供一种时间序列异常检测方法及装置,所述方法包括:获取包含有标注数据的标注数据集合;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。所述装置执行上述方法。本发明专利技术实施例提供的方法及装置,能够提高时间序列异常检测的适用性。

A Time Series Anomaly Detection Method and Device

The embodiment of the present invention provides a time series anomaly detection method and device. The method includes: acquiring a set of annotated data containing annotated data; acquiring a set of corresponding feature combinations of each annotated data in the set of annotated data; and acquiring and combining with each other according to all feature combinations, all annotated types and preset feature combinations corresponding to each annotated data. Candidate data with similar annotated data; target data that can be used to optimize the preset model is extracted from all candidate data; optimal processing strategy of the preset model is determined based on all target data; anomaly detection of the detected time series is carried out through the optimized preset model. The device performs the above method. The method and device provided by the embodiment of the present invention can improve the applicability of time series anomaly detection.

【技术实现步骤摘要】
一种时间序列异常检测方法及装置
本专利技术实施例涉及时间序列
,具体涉及一种时间序列异常检测方法及装置。
技术介绍
时间序列,是指将同一统计指标的数值按时间先后顺序排列得到的数值序列(例如:某服务器每小时的网络吞吐量、某网站每分钟的访问次数等)。时间序列异常检测,是指检测时间序列中某个数值或者某个数值子序列是否偏离了正常模式。现有检测时间序列是否异常的方法,主要是利用统计或者机器学习算法进行异常检测,普遍存在如下缺陷:(1)针对特定场景或者具有相似异常模式的某一类检测对象分别建立模型,通用性不强;(2)误报率和漏报率都较高;(3)需要人工对较多的待检测时间序列进行标注,效率低下。因此,如何避免上述缺陷,能够提高时间序列异常检测的适用性,成为亟须解决的问题。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种时间序列异常检测方法及装置。第一方面,本专利技术实施例提供一种时间序列异常检测方法,所述方法包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。第二方面,本专利技术实施例提供一种时间序列异常检测装置,所述装置包括:第一获取单元,用于获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;第二获取单元,用于获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;提取单元,用于在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;检测单元,用于根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。第三方面,本专利技术实施例提供一种电子设备,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。本专利技术实施例提供的时间序列异常检测方法及装置,通过获取与更新标注对应的各标注数据相似的候选数据、并基于候选数据提取目标数据,再根据目标数据确定对预设模型的优化处理策略,通过优化过的预设模型检测时间序列,能够提高时间序列异常检测的适用性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例时间序列异常检测方法流程示意图;图2为基于模块化设计的实现本专利技术实施例的方法的示意图;图3为本专利技术实施例对预设模型的优化处理流程图;图4为本专利技术另一实施例时间序列异常检测方法流程示意图;图5为本专利技术实施例时间序列异常检测装置结构示意图;图6为本专利技术实施例提供的电子设备实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了便于理解,先对本专利技术实施例涉及的部分名词作简要说明,如表1所示:表1图1为本专利技术实施例时间序列异常检测方法流程示意图,如图1所示,本专利技术实施例提供的一种时间序列异常检测方法,包括以下步骤:S101:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据。具体的,装置获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据。装置可以理解为执行该方法的设备等。标注数据可以是经过业务人员确认的、每次确认的批量标注数据组成标注数据集合。对时间序列说明如下:对某网页以10分钟为窗口的访客量进行计数统计,考虑时间因素可以得到序列[(2018-08-0709:10:00,34),(2018-08-0709:20:00,12),(2018-08-0709:30:00,67),(2018-08-0709:40:00,34),……,(2018-08-0710:10:00,2)],如果不考虑时间因素可以得到序列:[34,12,67,34,.....,2]、以时间序列[34,12,67,34,.....,2]为例,检测结果为[0,0,0,1,.....,0],业务人员确认时间序列中“2”对应的检测结果“0”存在错误,则将2018-08-0710:10:00的该网页的访客量作为标注数据。然后,该方法自动识别该标注数据的标注类型。标注类型可以包括漏报点、误报点等。S102:获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据。具体的,装置获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据本文档来自技高网...

【技术保护点】
1.一种时间序列异常检测方法,其特征在于,包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。

【技术特征摘要】
1.一种时间序列异常检测方法,其特征在于,包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。2.根据权利要求1所述的方法,其特征在于,所述根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据,包括:获取每种标注类型对应的各目标标注数据;对数据集中的数据进行初筛选,以获取需保留的备选数据;根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合;根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度;将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。3.根据权利要求1所述的方法,其特征在于,所述在所有候选数据中提取可用于优化预设模型的目标数据,包括:获取各候选数据的检测类型;在第一预设时间窗口内获取检测类型为正常点的各第一候选数据;分别计算各标注数据与各第一候选数据之间的第二相似度;将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据;获取检测类型为告警点或异常点的各第二候选数据;根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段;根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。4.根据权利要求1所述的方法,其特征在于,所述根据所有目标数据,确定对所述预设模型的优化处理策略,包括:获取各目标数据分别对应的标注类型;若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则;若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若确定为否,则统计不存在异常点中的全部漏报点;若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。6.一种时间序列异常检测装置,其特征在于,包括:第一获取单元,用于获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结...

【专利技术属性】
技术研发人员:张顺龙王占一
申请(专利权)人:北京奇安信科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1