数据异常检测方法及其装置、电子设备制造方法及图纸

技术编号:32231102 阅读:17 留言:0更新日期:2022-02-09 17:35
本发明专利技术公开了一种数据异常检测方法及其装置、电子设备。其中,该检测方法包括:接收产品运行数据,将产品运行数据发送至目标园区,其中,目标园区接入有异常检测系统,异常检测系统中运行有数据检测模型,数据检测模型在模型训练过程中对导致损失值率大于预设概率阈值的样本数据进行挖掘,并且重新训练样本数据,损失值率用于指示模型分类错误的样本数据量与总数据量的比值,采用异常检测系统对产品运行数据进行分析,得到检测结果,将检测结果中的异常数据发送至告警系统。本发明专利技术解决了相关技术中异常检测系统的检测准确率较低的技术问题。术问题。术问题。

【技术实现步骤摘要】
数据异常检测方法及其装置、电子设备


[0001]本专利技术涉及数据处理
,具体而言,涉及一种数据异常检测方法及其装置、电子设备。

技术介绍

[0002]在金融科技行业中,大多企业/公司开始搭建基于人工智能算法的告警系统,用于识别异常数据,以使得相关人员能够快速处理这些数据。相关技术中,通过引入已成熟的人工智能算法,设计基于历史数据训练得到的模型,用以检测生产中的异常数据,进而发出告警。然而,现有的模型是通过前一个周期的离线数据进行训练以及迭代得到,随着金融业务领域的快速发展,各种训练样本中存在着较多难分正负样本,从而导致现有的模型的实际检测率降低,降低了检测准确率的问题。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种数据异常检测方法及其装置、电子设备,以至少解决相关技术中异常检测系统的检测准确率较低的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种数据异常检测方法,包括:接收产品运行数据;将所述产品运行数据发送至目标园区,其本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据异常检测方法,其特征在于,包括:接收产品运行数据;将所述产品运行数据发送至目标园区,其中,所述目标园区接入有异常检测系统,所述异常检测系统中运行有数据检测模型,所述数据检测模型在模型训练过程中对导致损失值率大于预设概率阈值的样本数据进行挖掘,并且重新训练所述样本数据,所述损失值率用于指示模型分类错误的样本数据量与总数据量的比值;采用所述异常检测系统对所述产品运行数据进行分析,得到检测结果;将检测结果中的异常数据发送至告警系统。2.根据权利要求1所述的检测方法,其特征在于,在接收产品运行数据之前,所述检测方法还包括:获取历史过程中第一预设时间段内的产品运行数据,得到历史样本数据;接收外部终端设备输入的产品运行数据的产品错分数据,其中,所述产品错分数据指示在模型训练过程中导致损失值率大于预设概率阈值的样本数据;将所述历史样本数据和所述产品错分数据输入至数据检测模型,以对所述数据检测模型进行迭代训练。3.根据权利要求2所述的检测方法,其特征在于,将所述历史样本数据和所述产品错分数据输入至数据检测模型,以对所述数据检测模型进行迭代训练的步骤,包括:采用预设正态分布算法对所述历史样本数据进行异常检测,得到负样本集合和正样本集合;采用局部异常因子算法对所述正样本集合中的样本数据进行分析,以确定所述正样本集合中的错分数据,完成模型训练。4.根据权利要求3所述的检测方法,其特征在于,采用预设正态分布算法对所述历史样本数据进行异常检测,得到负样本集合和正样本集合的步骤,包括:以每个待检测指标为基准,提取所述历史样本数据中对应于每个所述待检测指标的样本数据;对提取出的所有样本数据进行样本均值计算,得到指标检测均值;对提取出的所有样本数据进行样本方差计算,得到指标检测方差值;基于所述指标检测均值和所述指标检测方差值,计算正态分布区域;将处于正态分布区域所述历史样本数据分类至正样本集合,将未落于正态分布区域的所述历史样本数据分类至所述负样本集合。5.根据权利要求3所述的检测方法,其特征在于,采用局部异常因子算法对所述正样本集合中的样本数据进行分析,以确定所述正样本集合中的错分数据的步骤,包括:将所述历史样本数据中,与每个待检测指标对应的指标数据和对应的数据时间进行组合,得到多个时序数据;以每个所述时序数据为中心,确定处于目标时序数据的周围邻域点,得到邻域集合;计算所述邻域集合中其它邻域点的可达距离以及所述目标时序数据的局部可达密度;计算所述邻域集合内所有其它邻域点的局部可达密度的密度均值,并计算所述密度均值与所述目标时...

【专利技术属性】
技术研发人员:张为欢王培君管虹翔梁广会
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1