用于生成规则集的方法及装置制造方法及图纸

技术编号:36345261 阅读:65 留言:0更新日期:2023-01-14 17:59
本说明书实施例提供了用于生成规则集的方法及装置。在该方法中,基于数据样本确定各个决策条件以及各个决策条件包括的特征;利用神经网络对各个决策条件以及各个特征进行向量化处理,以得到各个决策条件对应的条件向量化表征以及各个特征对应的特征向量化表征;根据各个决策条件对应的条件向量化表征确定各个决策条件之间的条件关联性;根据各个决策条件以及条件关联性构建决策条件关系图;根据各个特征对应的特征向量化表征确定各个特征之间的特征关联性;根据各个特征以及特征关联性构建特征关系图;以及根据决策条件关系图以及特征关系图抽取多个规则,以得到规则集。以得到规则集。以得到规则集。

【技术实现步骤摘要】
用于生成规则集的方法及装置


[0001]本说明书实施例涉及人工智能的
,具体地,涉及用于生成规则集的方法及装置。

技术介绍

[0002]在人工智能领域中,用于决策的规则因为其具有可解释性以及有效性的特点,被广泛应用于分类场景中,尤其是在金融领域中的风险控制。对于所应用的规则来说,需要挖掘出若干个规则组成规则集,规则集作为一个模型被应用在场景中。
[0003]目前,规则的一种获取方式是通过构建决策树,从所构建的决策树中抽取规则来构成规则集。

技术实现思路

[0004]鉴于上述,本说明书实施例提供了用于生成规则集的方法及装置。通过本说明书实施例的技术方案,以全局的角度探索决策条件之间的关联性,且通过特征关系图从决策条件关系图中抽取规则,确保了每条规则中所包括的特征的多样性。
[0005]根据本说明书实施例的一个方面,提供了一种用于生成规则集的方法,包括:基于包括有标签的数据样本确定各个决策条件以及所述各个决策条件包括的特征;利用神经网络对所述各个决策条件以及各个特征进行向量化处理,以得到所述各个决策条件对应的条件向量化表征以及所述各个特征对应的特征向量化表征,其中,所述神经网络是利用映射后的数据样本作为训练样本进行训练得到的,所述映射后的数据样本是将所述数据样本中的各个数据映射至所述各个决策条件得到的;根据所述各个决策条件对应的条件向量化表征确定所述各个决策条件之间的条件关联性;根据所述各个决策条件以及所述条件关联性构建以决策条件为节点的决策条件关系图;根据所述各个特征对应的特征向量化表征确定所述各个特征之间的特征关联性;根据所述各个特征以及所述特征关联性构建以特征为节点的特征关系图;以及根据所述决策条件关系图以及所述特征关系图抽取多个规则,以得到由所述多个规则构成的规则集,其中,每个规则包括多个决策条件。
[0006]根据本说明书实施例的另一方面,还提供一种用于生成规则集的装置,包括:决策条件确定单元,基于包括有标签的数据样本确定各个决策条件以及所述各个决策条件包括的特征;向量化处理单元,利用神经网络对所述各个决策条件以及各个特征进行向量化处理,以得到所述各个决策条件对应的条件向量化表征以及所述各个特征对应的特征向量化表征,其中,所述神经网络是利用映射后的数据样本作为训练样本进行训练得到的,所述映射后的数据样本是将所述数据样本中的各个数据映射至所述各个决策条件得到的;条件关联性确定单元,根据所述各个决策条件对应的条件向量化表征确定所述各个决策条件之间的条件关联性;决策条件关系图构建单元,根据所述各个决策条件以及所述条件关联性构建以决策条件为节点的决策条件关系图;特征关联性确定单元,根据所述各个特征对应的特征向量化表征确定所述各个特征之间的特征关联性;特征关系图构建单元,根据所述各
个特征以及所述特征关联性构建以特征为节点的特征关系图;以及规则抽取单元,根据所述决策条件关系图以及所述特征关系图抽取多个规则,以得到由所述多个规则构成的规则集,其中,每个规则包括多个决策条件。
[0007]根据本说明书实施例的另一方面,还提供一种电子设备,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如上述任一所述的用于生成规则集的方法。
[0008]根据本说明书实施例的另一方面,还提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的用于生成规则集的方法。
[0009]根据本说明书实施例的另一方面,还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上任一所述的用于生成规则集的方法。
附图说明
[0010]通过参照下面的附图,可以实现对于本说明书实施例内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。
[0011]图1示出了根据本说明书实施例的用于生成规则集的方法的一个示例的流程图。
[0012]图2示出了根据本说明书实施例的数据样本的一个示例的示意图。
[0013]图3示出了根据本说明书实施例的基于数据样本构建决策树的一个示例的示意图。
[0014]图4示出了根据本说明书实施例的映射后的数据样本的一个示例的示意图。
[0015]图5示出了根据本说明书实施例的根据决策条件关系图以及特征关系图得到规则集的一个示例的流程图。
[0016]图6示出了根据本说明书实施例的根据决策条件关系图以及特征关系图抽取特征节点路径和决策条件节点路径的一个示例的示意图。
[0017]图7示出了根据本说明书实施例的抽取决策条件节点路径的一个示例的流程图。
[0018]图8示出了根据本说明书实施例的规则集生成装置的一个示例的方框图。
[0019]图9示出了根据本说明书实施例的规则抽取单元的一个示例的方框图。
[0020]图10示出了本说明书实施例的用于实现规则集生成方法的电子设备的方框图。
具体实施方式
[0021]以下将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书实施例内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
[0022]如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明
确地指明,否则一个术语的定义在整个说明书中是一致的。
[0023]在本说明书中,术语“模型”是指被应用于业务场景中来进行业务预测服务的机器学习模型,比如,用于分类预测、业务风险预测等等的机器学习模型。机器学习模型的示例可以包括但不限于:线性回归模型、逻辑回归模型、神经网络模型、决策树模型、支持向量机等。神经网络模型的示例可以包括但不限于深度神经网络(DNN,Deep Neural Network)模型、卷积神经网络(CNN,Convolutional Neural Network)模型、BP神经网络等。
[0024]模型的具体实现形式取决于所应用的业务场景。例如,在模型应用于对用户进行分类的应用场景,则模型被实现为用户分类模型。相应地,可以根据该模型来对待分类用户的用户特征数据进行用户分类预测。在模型应用于对业务系统上发生的业务交易进行业务风险预测的应用场景,则模型被实现为业务风险预测模型。相应地,可以根据该模型来对该业务交易的业务交易特征数据进行业务风险预测。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于生成规则集的方法,包括:基于包括有标签的数据样本确定各个决策条件以及所述各个决策条件包括的特征;利用神经网络对所述各个决策条件以及各个特征进行向量化处理,以得到所述各个决策条件对应的条件向量化表征以及所述各个特征对应的特征向量化表征,其中,所述神经网络是利用映射后的数据样本作为训练样本进行训练得到的,所述映射后的数据样本是将所述数据样本中的各个数据映射至所述各个决策条件得到的;根据所述各个决策条件对应的条件向量化表征确定所述各个决策条件之间的条件关联性;根据所述各个决策条件以及所述条件关联性构建以决策条件为节点的决策条件关系图;根据所述各个特征对应的特征向量化表征确定所述各个特征之间的特征关联性;根据所述各个特征以及所述特征关联性构建以特征为节点的特征关系图;以及根据所述决策条件关系图以及所述特征关系图抽取多个规则,以得到由所述多个规则构成的规则集,其中,每个规则包括多个决策条件。2.如权利要求1所述的方法,其中,根据所述各个决策条件对应的条件向量化表征确定所述各个决策条件之间的条件关联性包括:根据所述条件向量化表征以及各个标签对应的标签向量化表征确定所述各个决策条件之间的条件关联性。3.如权利要求2所述的方法,其中,根据所述条件向量化表征以及各个标签对应的标签向量化表征确定所述各个决策条件之间的条件关联性包括:针对所述各个决策条件中的两个决策条件以及所述各个标签,根据该两个决策条件对应的条件向量化表征与该标签对应的标签向量化表征确定该两个决策条件与该标签之间的第一标签关联性;以及根据该两个决策条件对应的针对所述各个标签的第一标签关联性,确定该两个决策条件之间的条件关联性。4.如权利要求1所述的方法,其中,根据所述各个特征对应的特征向量化表征确定所述各个特征之间的特征关联性包括:根据所述特征向量化表征以及所述各个标签对应的标签向量化表征确定所述各个特征之间的特征关联性。5.如权利要求4所述的方法,其中,根据所述特征向量化表征以及所述各个标签对应的标签向量化表征确定所述各个特征之间的特征关联性包括:针对所述各个特征中的两个特征以及所述各个标签,根据该两个特征对应的特征向量化表征与该标签对应的特征向量化表征来确定该两个特征与该标签之间的第二标签关联性;以及根据该两个特征对应的针对所述各个标签的第二标签关联性,确定该两个特征之间的特征关联性。6.如权利要求1所述的方法,其中,根据所述决策条件关系图以及所述特征关系图抽取多个规则,以得到由所述多个规则构成的规则集包括:从所述特征关系图中抽取至少一条特征节点路径;
针对各条特征节点路径,根据该特征节点路径从所述决策条件关系图中抽取对应的至少一条决策条件节点路径,每条决策条件节点路径作为一个规则;以及基于由所抽取的各条决策条件节点路径所形成的规则得到规则集。7.如权利要求6所述的方法,其中,针对各条特征节点路径,根据该特征节点路径从所述决策条件关系图中抽取对应的至少一条决策条件节点路径包括:针对各条特征节点路径,按照以下方式从所述决策条件关系图中抽取对应的决策条件节点路径:将该特征节点路径中的第一个特征节点确定为目标特征节点;根据所述目标特征节点从所述决策条件关系图中确定用于决策条件节点路径的决策条件节点;在该特征节点路径中还存在未作为目标特征节点的特征节点时,将该特征节点路径中的下一个特征节点确定为下一个循环中的目标特征节点,并返回执行根据目标特征节点确定决策条件节点的操作;以及在该特征节点路径中不存在未作为目标特征节点的特征节点时,输出由所确定出的各个决策条件节点按序构成的决策条件节点路径。8.如权利要求7所述的方法,其中,根据所述目标特征节点从所述决策条件关系图中确定用于决策条件节...

【专利技术属性】
技术研发人员:余露李盟李龙飞
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1