一种告警分类方法及装置、电子设备制造方法及图纸

技术编号:28210654 阅读:24 留言:0更新日期:2021-04-24 14:46
本申请公开了一种告警分类方法及装置、电子设备,所述方法包括:基于历史告警样本数据确定至少两个样本集;基于每个所述样本集中信息增益比率最大的样本特征,构建每个所述样本集对应的决策树模型;将待分类告警数据分别输入至每个所述决策树模型,基于全部所述决策树模型的输出结果确定所述待分类告警数据的处理类别。如此,能够通过决策树模型对告警数据自动进行分类过滤。自动进行分类过滤。自动进行分类过滤。

【技术实现步骤摘要】
一种告警分类方法及装置、电子设备


[0001]本申请涉及金融
,尤其涉及一种告警分类方法及装置、电子设备。

技术介绍

[0002]随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,然而,由于金融行业的安全性、实时性要求,金融科技也对技术提出了更高的要求。金融科技领域下,智能监控系统(Intelligent Monitor System,IMS)日告警数据量可达几百条,月告警数据量也可达上万条;因此,需要对告警数据进行筛选和删除,再对告警数据分类,以获得有效的告警数据。然而,现有的对告警数据分类的方法存在需要工作人员参与、适用的场景有限等问题。
[0003]申请内容
[0004]为解决上述技术问题,本申请实施例提供了一种告警分类方法及装置、计算机程序产品、存储介质、电子设备,能够自动对告警数据进行准确分类,且具有普适性。
[0005]本申请实施例提供的一种告警分类方法,包括:基于历史告警样本数据确定至少两个样本集;
[0006]基于每个所述样本集中信息增益比率最大的样本特征,构建每个所述样本集对应的决策树模型;
[0007]将待分类告警数据分别输入至每个所述决策树模型,基于全部所述决策树模型的输出结果确定所述待分类告警数据的处理类别。
[0008]本申请一可选实施方式中,所述基于历史告警样本数据确定至少两个样本集之前,所述方法还包括:
[0009]对历史告警数据进行筛选处理,获得历史告警样本数据。
>[0010]本申请一可选实施方式中,所述基于每个所述样本集中信息增益比率最大的样本特征,构建每个所述样本集对应的决策树模型包括:
[0011]确定每个所述样本集中信息增益比率最大的样本特征;
[0012]以每个所述样本集中信息增益比率最大的样本特征作为所述决策树模型的节点,构建每个所述样本集对应的决策树模型。
[0013]本申请一可选实施方式中,所述确定每个所述样本集中信息增益比率最大的样本特征,包括:
[0014]计算每个所述样本集的经验熵;
[0015]针对每个所述样本集,以样本特征为粒度计算所述样本特征的经验条件熵;
[0016]基于所述经验熵和所述经验条件熵确定所述样本特征的信息增益;
[0017]计算每个所述样本集的惩罚项,基于所述惩罚项和所述样本特征的信息增益确定信息增益比率最大的样本特征。
[0018]本申请一可选实施方式中,所述方法还包括:
[0019]按第一时间周期更新所述历史告警样本数据;
[0020]基于更新的所述历史告警样本数据,更新所述决策树模型。
[0021]本申请实施例提供一种告警分类装置,所述装置包括:
[0022]确定单元,用于基于历史告警样本数据确定至少两个样本集;
[0023]构建单元,用于基于每个所述样本集中信息增益比率最大的样本特征,构建每个所述样本集对应的决策树模型;
[0024]分类单元,用于将待分类告警数据分别输入至每个所述决策树模型,基于全部所述决策树模型的输出结果确定所述待分类告警数据的处理类别。
[0025]本申请一可选实施方式中,所述装置还包括:
[0026]筛选单元,用于对历史告警数据进行筛选处理,获得历史告警样本数据。
[0027]本申请一可选实施方式中,所述构建单元,用于确定每个所述样本集中信息增益比率最大的样本特征;
[0028]以每个所述样本集中信息增益比率最大的样本特征作为所述决策树模型的节点,构建每个所述样本集对应的决策树模型。
[0029]本申请一可选实施方式中,所述构建单元,用于计算每个所述样本集的经验熵;
[0030]针对每个所述样本集,以样本特征为粒度计算所述样本特征的经验条件熵;
[0031]基于所述经验熵和所述经验条件熵确定所述样本特征的信息增益;
[0032]计算每个所述样本集的惩罚项,基于所述惩罚项和所述样本特征的信息增益确定信息增益比率最大的样本特征。
[0033]本申请一可选实施方式中,所述装置还包括:
[0034]更新单元,用于按第一时间周期更新所述历史告警样本数据;
[0035]基于更新的所述历史告警样本数据,更新所述决策树模型。
[0036]本申请实施例还提供一种存储介质,所述存储介质上存储有可执行指令,该可执行指令被处理器执行时实现上述的方法步骤。
[0037]本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时可实现上述的方法步骤。
[0038]本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,该计算机可执行指令被执行后,能够实现上述的方法步骤。
[0039]本申请实施例提供的告警分类方法,基于历史告警样本数据确定至少两个样本集;基于每个所述样本集中信息增益比率最大的样本特征,构建每个所述样本集对应的决策树模型;将待分类告警数据分别输入至每个所述决策树模型,基于全部所述决策树模型的输出结果确定所述待分类告警数据的处理类别。如此,通过历史告警样本数据构建决策树模型,利用决策树模型对新的告警进行分类,无需人为的修改告警过滤条件,无需修改代码,系统可自动对告警进行分类,提高告警分类的实时性;基于信息增益比率最大的样本特征构建每个样本集对应的决策树模型,使得构建出的决策树模型在进行告警分类时最简洁、最有效。另外,本申请实施例提供的告警分类方法在对告警分类时,无需根据不同的场景配置告警过滤条件实现,而是根据包括各种场景下的历史告警样本数据构建的决策树模型实现,因此,本申请实施例提供的告警分类方法适用于不同的场景,降低了人力成本。
[0040]为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合
附附图,作详细说明如下。
附图说明
[0041]图1为本申请告警过滤器的配置界面示意图;
[0042]图2为本申请实施例提供的告警分类方法的一种可选处理流程示意图;
[0043]图3为本申请实施例样本集的数据示意图;
[0044]图4为本申请实施例历史告警数据的示意图;
[0045]图5为本申请实施例告警分类装置构建每个所述样本集对应的决策树模型的处理过程;
[0046]图6为本申请实施例告警分类装置确定每个所述样本集中信息增益比率最大的样本特征的处理过程;
[0047]图7为本申请实施例提供的样本特征的示意图,
[0048]图8为本申请实施例提供的复杂决策树模型的示意图;
[0049]图9为本申请实施例提供的随机森林的示意图;
[0050]图10为本申请实施例的告警分类装置的结构组成示意图。
[0051]图11为本申请实施例的电子设备的结构组成示意图。
具体实施方式本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种告警分类方法,其特征在于,所述方法包括:基于历史告警样本数据确定至少两个样本集;基于每个所述样本集中信息增益比率最大的样本特征,构建每个所述样本集对应的决策树模型;将待分类告警数据分别输入至每个所述决策树模型,基于全部所述决策树模型的输出结果确定所述待分类告警数据的处理类别。2.根据权利要求1所述的方法,其特征在于,所述基于每个所述样本集中信息增益比率最大的样本特征,构建每个所述样本集对应的决策树模型包括:确定每个所述样本集中信息增益比率最大的样本特征;以每个所述样本集中信息增益比率最大的样本特征作为所述决策树模型的节点,构建每个所述样本集对应的决策树模型。3.根据权利要求2所述的方法,其特征在于,所述确定每个所述样本集中信息增益比率最大的样本特征,包括:计算每个所述样本集的经验熵;针对每个所述样本集,以样本特征为粒度计算所述样本特征的经验条件熵;基于所述经验熵和所述经验条件熵确定所述样本特征的信息增益;计算每个所述样本集的惩罚项,基于所述惩罚项和所述样本特征的信息增益确定信息增益比率最大的样本特征。4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于历史告警样本数据确定至少两个样本集之前,所述方法还包括:对历史告警数据进行筛选处理,获得历史告警样本数据。5.根据权利要求1至3任一项所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:邱文曾可卢道和罗锶万亿兵陈亚锋冯期明邵海涛
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1