异常数据监测方法、装置、计算机设备及介质制造方法及图纸

技术编号:34385183 阅读:14 留言:0更新日期:2022-08-03 21:06
本申请实施例适用于机器学习技术领域,提供了一种异常数据监测方法、装置、计算机设备及介质,所述方法包括:从预设的样本群中确定多个子样本群,所述子样本群中包括正样本和负样本,所述子样本群中的所述正样本的数量大于所述负样本的数量;根据所述子样本群,建立正向树和负向树;对所述正向树和所述负向树进行融合,得到组合树;基于与多个所述子样本群一一对应的多个所述组合树,建立预测模型;采用所述预测模型,进行异常数据监测。通过上述方法建立的预测模型具有较高的稳定性和有效性,基于该预测模型进行异常数据监测得到的监测结果准确性更高。结果准确性更高。结果准确性更高。

【技术实现步骤摘要】
异常数据监测方法、装置、计算机设备及介质


[0001]本申请属于机器学习
,特别是涉及一种异常数据监测方法、装置、计算机设备及介质。

技术介绍

[0002]当某个目标对应的数据出现异常时,往往意味着该目标已经偏离了预期,可能会带来失误或其他损失。比如,当银行的客户的账户数据出现异常时,可能预示着该客户将会破产,造成坏账,给银行带来经济损失。
[0003]通过监测异常数据,可以预测出行为异常的目标,从而降低损失。但是,数据中的异常数据往往比较少,很难通过通用的分类模型或者回归模型对异常数据进行监测。
[0004]目前,在进行异常数据监测时,可以对全量用户群体进行分群,然后给不同客群画像,可以将画像异常的客群识别为风险客群。这种基于用户画像进行异常数据监测的方法,随着数据的改变,需要重新执行一遍包括分群、画像在内的全流程,方法繁琐、系统冗余。而且人为划分客群有较大随机性,人工画像也可能存在一定程度的不合理性,导致监测结果并不准确。

技术实现思路

[0005]有鉴于此,本申请实施例提供了一种异常数据监测方法、装置、计算机设备及介质,用以提高对异常数据进行监测的准确性。
[0006]本申请实施例的第一方面提供了一种异常数据监测方法,包括:
[0007]从预设的样本群中确定多个子样本群,所述子样本群中包括正样本和负样本,所述子样本群中的所述正样本的数量大于所述负样本的数量;
[0008]根据所述子样本群,建立正向树和负向树;
[0009]对所述正向树和所述负向树进行融合,得到组合树;
[0010]基于与多个所述子样本群一一对应的多个所述组合树,建立预测模型;
[0011]采用所述预测模型,进行异常数据监测。
[0012]本申请实施例的第二方面提供了一种异常数据监测装置,包括:
[0013]确定模块,用于从预设的样本群中确定多个子样本群,所述子样本群中包括正样本和负样本,所述子样本群中的所述正样本的数量大于所述负样本的数量;
[0014]建立模块,用于根据所述子样本群,建立正向树和负向树;
[0015]融合模块,用于对所述正向树和所述负向树进行融合,得到组合树;
[0016]生成模块,用于基于与多个所述子样本群一一对应的多个所述组合树,建立预测模型;
[0017]监测模块,用于采用所述预测模型,进行异常数据监测。
[0018]本申请实施例的第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序
时实现如上述第一方面所述的方法。
[0019]本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
[0020]本申请实施例的第五方面提供了一种计算机程序产品,当所述计算机程序产品在计算机设备上运行时,使得所述计算机设备执行上述第一方面所述的方法。
[0021]与现有技术相比,本申请实施例包括以下优点:
[0022]本申请实施例,可以从样本群中有放回抽样确定多个子样本群,然后基于每个子样本群,确定对应的正向树和负向树,由正向树和负向树组成一个组合树,使得组合树中的正向树和负向树可以相互抵消泛化风险;与子样本群一一对应的组合树可以组成组合森林,将训练后的组合森林作为预测模型,可以得到稳定性更高的预测模型,该模型可以对异常数据进行监测。本实施例中,利用正负树相互抵消风险,使得预测模型更为稳定,从而能够增强模型对异常数据的监测能力,保证监测结果的准确性。
附图说明
[0023]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是本申请实施例提供的一种异常数据监测方法的步骤流程示意图;
[0025]图2是本申请实施例提供的另一种异常数据监测方法的步骤流程示意图;
[0026]图3是本申请实施例提供的一种组合森林模型生成方法的流程示意图;
[0027]图4是本申请实施例提供的一种异常数据监测方法的流程示意图;
[0028]图5是本申请实施例提供的一种异常数据监测装置的示意图;
[0029]图6是本申请实施例提供的一种计算机设备的示意图。
具体实施方式
[0030]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0031]应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0032]还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0033]如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响
应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0034]另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0035]在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0036]下面通过具体实施例来说明本申请的技术方案。
[0037]参照图1,示出了本申请实施例提供的一种异常数据监测方法的步骤流程示意图,具体可以包括如下步骤:
[0038]S101,从预设的样本群中确定多个子样本群,所述子样本群中包括正样本和负样本,所述子样本群中的所述正样本的数量大于所述负样本的数量。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常数据监测方法,其特征在于,包括:从预设的样本群中确定多个子样本群,所述子样本群中包括正样本和负样本,所述子样本群中的所述正样本的数量大于所述负样本的数量;根据所述子样本群,建立正向树和负向树;对所述正向树和所述负向树进行融合,得到组合树;基于与多个所述子样本群一一对应的多个所述组合树,建立预测模型;采用所述预测模型,进行异常数据监测。2.如权利要求1所述的方法,其特征在于,所述样本群中的样本具有多个特征,所述根据所述子样本群,建立正向树和负向树,包括:根据所述多个特征和所述子样本群,建立正向树;对所述子样本群中的正样本进行降采样,对所述子样本群中的负样本进行扩充采样,得到至少一个负向子样本群;根据所述多个特征和至少一个所述负向子样本群,建立负向树。3.如权利要求2所述的方法,其特征在于,所述根据所述多个特征和所述子样本群,建立正向树,包括:确定所述正向树的根节点,所述根节点具有对应的根节点特征和根节点切割点;根据所述根节点特征和所述根节点切割点,建立所述根节点对应的子节点,所述子节点具有对应的子节点特征和子节点切割点;根据所述子节点特征和所述子节点切割点,建立所述子节点的下一级节点;当所述正向树的高度达到预设值或所述正向树的叶子节点上只对应一个样本时,确定所述正向树建立完成。4.如权利要求1

3任一项所述的方法,其特征在于,所述对所述正向树和所述负向树进行融合,得到组合树,包括:确定目标样本在所述正向树中的正向异常度;确定所述目标样本在所述负向树中的负向异常度;对所述正向异常度和所述负向异常进行加权计算,得到所述目标样本在所述组合树中的组合异常度。5.如权利要求4所述的方法,其特征在于,采用以下公式计算目标样本在所述正向树中的正向异常度:的正向异常度:其中,p1(xi,...

【专利技术属性】
技术研发人员:吴杨向彪赵占胜
申请(专利权)人:中和农信项目管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1