The embodiment of the present invention provides a time series anomaly detection method and device. The method includes: acquiring a set of annotated data containing annotated data; acquiring a set of corresponding feature combinations of each annotated data in the set of annotated data; and acquiring and combining with each other according to all feature combinations, all annotated types and preset feature combinations corresponding to each annotated data. Candidate data with similar annotated data; target data that can be used to optimize the preset model is extracted from all candidate data; optimal processing strategy of the preset model is determined based on all target data; anomaly detection of the detected time series is carried out through the optimized preset model. The device performs the above method. The method and device provided by the embodiment of the present invention can improve the applicability of time series anomaly detection.
【技术实现步骤摘要】
一种时间序列异常检测方法及装置
本专利技术实施例涉及时间序列
,具体涉及一种时间序列异常检测方法及装置。
技术介绍
时间序列,是指将同一统计指标的数值按时间先后顺序排列得到的数值序列(例如:某服务器每小时的网络吞吐量、某网站每分钟的访问次数等)。时间序列异常检测,是指检测时间序列中某个数值或者某个数值子序列是否偏离了正常模式。现有检测时间序列是否异常的方法,主要是利用统计或者机器学习算法进行异常检测,普遍存在如下缺陷:(1)针对特定场景或者具有相似异常模式的某一类检测对象分别建立模型,通用性不强;(2)误报率和漏报率都较高;(3)需要人工对较多的待检测时间序列进行标注,效率低下。因此,如何避免上述缺陷,能够提高时间序列异常检测的适用性,成为亟须解决的问题。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种时间序列异常检测方法及装置。第一方面,本专利技术实施例提供一种时间序列异常检测方法,所述方法包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。第二方面,本专利技术实施例提供一种时 ...
【技术保护点】
1.一种时间序列异常检测方法,其特征在于,包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
【技术特征摘要】
1.一种时间序列异常检测方法,其特征在于,包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。2.根据权利要求1所述的方法,其特征在于,所述根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据,包括:获取每种标注类型对应的各目标标注数据;对数据集中的数据进行初筛选,以获取需保留的备选数据;根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合;根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度;将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。3.根据权利要求1所述的方法,其特征在于,所述在所有候选数据中提取可用于优化预设模型的目标数据,包括:获取各候选数据的检测类型;在第一预设时间窗口内获取检测类型为正常点的各第一候选数据;分别计算各标注数据与各第一候选数据之间的第二相似度;将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据;获取检测类型为告警点或异常点的各第二候选数据;根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段;根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。4.根据权利要求1所述的方法,其特征在于,所述根据所有目标数据,确定对所述预设模型的优化处理策略,包括:获取各目标数据分别对应的标注类型;若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则;若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若确定为否,则统计不存在异常点中的全部漏报点;若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。6.一种时间序列异常检测装置,其特征在于,包括:第一获取单元,用于获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结...
【专利技术属性】
技术研发人员:张顺龙,王占一,
申请(专利权)人:北京奇安信科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。