规则挖掘方法以及装置制造方法及图纸

技术编号:37509222 阅读:21 留言:0更新日期:2023-05-07 09:48
本说明书实施例提供规则挖掘方法以及装置,其中所述规则挖掘方法包括:获取业务数据,并在所述业务数据中筛选关联目标业务场景的数值可计算列;根据计算操作符和所述数值可计算列构建多个图节点;将所述多个图节点输入至规则预测模型,通过所述规则预测模型中的融合单元和链接预测单元对所述多个图节点进行处理,获得图节点链接关系;基于所述图节点链接关系,生成所述目标业务场景对应的数值列计算规则。规则。规则。

【技术实现步骤摘要】
规则挖掘方法以及装置


[0001]本说明书实施例涉及机器学习
,特别涉及规则挖掘方法以及装置。

技术介绍

[0002]随着互联网技术的发展,线上服务在越来越多的场景中得以应用,有效的为用户提供更加便捷的服务。而在线上服务中,社交、风控、代码质量或核对关联等图结构数据中蕴含着大量的点边交互的拓扑信息,这些信息可以进行有效建模并用于风险欺诈,代码漏洞扫描,及核对规则关联挖掘等业务场景中。而在安全风控场景下,数值型的关联型规则(规则主体包含两列以上)主要以一致性规则为主,但是还存在具有更复杂的计算关联的场景(线性,不等式)存在,仅靠规则主体仅包含的单列的规则和一致性规则,很难做到完全覆盖数值列全部类型。并且考虑到不同数值列之间存在的规则关系不定,更多规则的配置都是通过人工梳理业务代码逻辑后,根据人工经验进行配置后完成,不仅会浪费人力物力,而且效率低,还无法确保配置规则的全面性,因此亟需一种有效的方案以解决上述问题。

技术实现思路

[0003]有鉴于此,本说明书实施例提供了一种规则挖掘方法。本说明书一个或者多个实施例同时涉及一种规则挖掘装置,一种计算设备,一种计算机可读存储介质以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面,提供了一种规则挖掘方法,包括:
[0005]获取业务数据,并在所述业务数据中筛选关联目标业务场景的数值可计算列;
[0006]根据计算操作符和所述数值可计算列构建多个图节点;
[0007]将所述多个图节点输入至规则预测模型,通过所述规则预测模型中的融合单元和链接预测单元对所述多个图节点进行处理,获得图节点链接关系;
[0008]基于所述图节点链接关系,生成所述目标业务场景对应的数值列计算规则。
[0009]根据本说明书实施例的第二方面,提供了一种规则挖掘装置,包括:
[0010]获取模块,被配置为获取业务数据,并在所述业务数据中筛选关联目标业务场景的数值可计算列;
[0011]构建模块,被配置为根据计算操作符和所述数值可计算列构建多个图节点;
[0012]预测模块,被配置为将所述多个图节点输入至规则预测模型,通过所述规则预测模型中的融合单元和链接预测单元对所述多个图节点进行处理,获得图节点链接关系;
[0013]生成模块,被配置为基于所述图节点链接关系,生成所述目标业务场景对应的数值列计算规则。
[0014]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0015]存储器和处理器;
[0016]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令时实现任上述规则挖掘方法的步骤。
[0017]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述规则挖掘方法的步骤。
[0018]本实施例提供的规则挖掘方法,为了能够提高规则挖掘效率,且确保规则挖掘的全面性,可以在获取到全量的业务数据后,在业务数据中筛选出关联目标业务场景的数值可计算列,以实现对目标业务场景对应的计算规则进行挖掘。在此基础上,考虑到需要进行计算规则的挖掘,因此可以先根据计算操作符和数值可计算列构建多个图节点,实现在图结构的基础上完成挖掘处理。即将多个图节点输入至规则预测模型,实现通过规则预测模型中的融合单元和链接预测单元对多个图节点进行处理,以根据处理结果得到图节点链接关系,实现通过规则预测模型挖掘出全部可能存在的节点链接关系。在此基础上,通过对图节点链接关系进行拼接,即可根据拼接结果得到目标业务场景关联的数值列计算规则,实现在不需要人为参与的情况下,可以通过规则预测模型准确且高效的预测全部链接关系,并构建计算规则,极大的缩小了数值可计算列的计算规则可搜索空间,实现提高规则挖掘的泛化能力。
附图说明
[0019]图1是本说明书一个实施例提供的一种规则挖掘方法的示意图;
[0020]图2是本说明书一个实施例提供的一种规则挖掘方法的流程图;
[0021]图3是本说明书一个实施例提供的一种规则挖掘方法中特征生成的示意图;
[0022]图4是本说明书一个实施例提供的一种规则挖掘方法中图节点构建的示意图;
[0023]图5是本说明书一个实施例提供的一种规则挖掘方法的处理过程流程图;
[0024]图6是本说明书一个实施例提供的一种规则挖掘装置的结构示意图;
[0025]图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0026]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0027]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0028]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0029]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0030]图结构数据:(Graph Data)描述了一种复杂的非线形,且无法在欧式空间进行描
述数据存储结构。图结构数据可以迅速的描述物理世界中的概念及其相互关系。图结果数据可以通过建模的方法来形成相应的点



点关系,从而聚合大量知识信息。通过图结构数据所设计的建模方法已经广泛应用到智能搜索、智能问答、个性化推荐、情报分析、反欺诈等领域。在有多种边和节点关系的图数据被称为异构图。
[0031]图神经网络:(Graph Neural Network)是一类基于深度学习的处理图域信息的方法,并可以在社交网络或其它基于图结构数据上运行的一种深度学习架构,因此被定义为一种基于图结构的广义神经网络。由于其较好的性能和可解释性,GNN最近已成为一种广泛应用的图分析方法。
[0032]图表征学习(Graph Representation Learning)是基于图神经网络来对图结构数据中的点(Node)和边(Edge)关系来进行嵌入向量(Embedding)学习的过程,同时也是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种规则挖掘方法,包括:获取业务数据,并在所述业务数据中筛选关联目标业务场景的数值可计算列;根据计算操作符和所述数值可计算列构建多个图节点;将所述多个图节点输入至规则预测模型,通过所述规则预测模型中的融合单元和链接预测单元对所述多个图节点进行处理,获得图节点链接关系;基于所述图节点链接关系,生成所述目标业务场景对应的数值列计算规则。2.根据权利要求1所述的方法,所述获取业务数据,并在所述业务数据中筛选关联目标业务场景的数值可计算列,包括:在目标数据库中提取所述业务数据;在所述业务数据包含的数值列中,选择枚举列类型的数值列作为所述目标业务场景对应的条件数值列;根据所述条件数值列的计算分布信息,在所述条件数值列中筛选所述数值可计算列。3.根据权利要求2所述的方法,所述在所述业务数据包含的数值列中,选择枚举列类型的数值列作为所述目标业务场景对应的条件数值列,包括:按照预设的选择策略对所述业务数据包含的数值列进行遍历;根据遍历结果选择所述枚举列类型的数值列作为所述目标业务场景对应的条件数值列。4.根据权利要求1所述的方法,所述根据计算操作符和所述数值可计算列构建多个图节点,包括:构建所述计算操作符对应的操作符特征,以及所述数值可计算列对应的数值列特征;通过对所述操作符特征和所述数值列特征分别进行图化处理,获得操作符特征节点和数值列特征节点;基于所述操作符特征节点和所述数值列特征节点,生成所述多个图节点。5.根据权利要求1所述的方法,所述将所述多个图节点输入至规则预测模型,通过所述规则预测模型中的融合单元和链接预测单元对所述多个图节点进行处理,获得图节点链接关系,包括:将所述多个图节点输入至所述规则预测模型;通过所述规则预测模型中的所述链接预测单元,计算所述多个图节点中操作符节点和数值列节点之间的子链接关系;通过所述规则预测模型中的所述融合单元对所述子链接关系进行融合处理;根据融合处理结果生成所述图节点链接关系。6.根据权利要求1所述的方法,所述基于所述图节点链接关系,生成所述目标业务场景对应的数值列计算规则,包括:将所述图节点链接关系写入目标关系集合;在所述目标关系集合满足规则生成条件的情况下,基于所述目标关系集合生成所述目标业务场景对应的所述数值列计算规则。7.根据权利要求6所述的方法,所述基于所述目标关系集合生成所述目标业务场景对应的所述数值列计算规则,包括:通过生成优化器对所述目标关系集合中包含的图节点链接关系进行线性组合处理,获
得图节点...

【专利技术属性】
技术研发人员:张铁华刘雨泽
申请(专利权)人:支付宝实验室新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1