一种自动规则挖掘方法及装置制造方法及图纸

技术编号:35459005 阅读:22 留言:0更新日期:2022-11-03 12:22
本发明专利技术公开了一种自动规则挖掘方法及装置,涉及规则挖掘技术领域,主要目的在于实现基于多算法实现,支持规则交互和过滤以及自动超参数优化的规则挖掘。本发明专利技术主要的技术方案为:获取目标数据;利用不同的预设抽取规则对所述目标数据进行规则抽取,得到多个待交叉规则;利用预设交叉规则对多个所述待交叉规则进行交叉处理,得到所述预设交叉规则对应的目标规则集;利用预设指标过滤规则对所述目标规则集进行规则过滤,得到选中的目标规则;将所述选中的目标规则进行汇总,形成分类器,且基于所述目标数据得到预测结果。本发明专利技术用于自动规则挖掘。则挖掘。则挖掘。

【技术实现步骤摘要】
一种自动规则挖掘方法及装置


[0001]本专利技术涉及规则挖掘
,尤其涉及一种自动规则挖掘方法及装置。

技术介绍

[0002]规则是简化版的模型,它具备极高的可解释性和可控性,可以应用于反欺诈和精准营销的模型前置流程中。规则挖掘通常采用特征工程与决策树模型相结合的方式,根据决策树特有的节点分裂方式实现规则的自动生成。
[0003]目前业界几乎只有决策树抽取规则这一种规则挖掘方法,决策树有多种类型,如ID3、C4.5、CART等,其中,基于分类回归树(CART)进行规则挖掘是目前风控领域常用的技术。CART叶节点的输出是当前节点标签的均值,这刚好等于该节点的负样本占比,优化目标就是找到根节点到负样本占比最小的叶节点路径,规则挖掘就是抽取出能形成这条路径的节点分裂方式。该技术常见的应用场景有互联网金融领域的信贷业务、精准营销、反欺诈检测等。
[0004]虽然决策树有多种类型,如ID3、C4.5、CART等,但都很难保证决策树算法能适用于所有风控场景,缺乏多角度规则挖掘的能力;对于挖掘得到的规则,目前也没有成熟的算法能够直接进行规则交互和过滤。

技术实现思路

[0005]鉴于上述问题,本专利技术提供一种自动规则挖掘方法及装置,主要目的是为了实现基于多算法实现,支持规则交互和过滤以及自动超参数优化的规则挖掘。
[0006]为解决上述技术问题,本专利技术提出以下方案:
[0007]第一方面,本专利技术提供一种自动规则挖掘方法,所述方法包括:
[0008]获取目标数据
[0009]利用不同的预设抽取规则对所述目标数据进行规则抽取,得到多个待交叉规则;
[0010]利用预设交叉规则对多个所述待交叉规则进行交叉处理,得到所述预设交叉规则对应的目标规则集;
[0011]利用预设指标过滤规则对所述目标规则集进行规则过滤,得到选中的目标规则;
[0012]将所述选中的目标规则进行汇总,形成分类器,且基于所述目标数据得到预测结果。
[0013]优选地,所述不同的预设抽取规则包括决策树规则、极端随机树规则、K

means规则、随机森林多变量规则和极端随机树多变量规则;
[0014]所述利用不同的预设抽取规则对所述目标数据进行规则抽取,得到多个待交叉规则,包括:
[0015]分别利用所述决策树规则、极端随机树规则、K

means规则、随机森林多变量规则和极端随机树多变量规则对所述目标数据进行规则抽取,得到所述每个抽取规则对应的待交叉规则。
[0016]优选地,所述预设交叉规则为二级联交叉规则和或多级联交叉规则;
[0017]所述利用预设交叉规则对多个所述待交叉规则进行交叉处理,得到所述预设交叉规则对应的目标规则集,包括:
[0018]获取所述多个待交叉规则;
[0019]当所述预设交叉规则为二级联交叉规则时,利用所述二级联交叉规则对所述多个待交叉规则进行二级联规则交叉,得到两两交叉的二级联规则集,且将所述两两交叉的二级联规则集作为所述目标规则集;
[0020]当所述预设交叉规则为多级联交叉规则时,利用所述多级联交叉规则对所述多个待交叉规则进行多级联规则交叉,得到多级联规则交叉的目标规则集;
[0021]当所述预设交叉规则为二级联交叉规则和多级联交叉规则时,利用所述二级联交叉规则对所述多个待交叉规则进行二级联规则交叉,得到两两交叉的二级联规则集;
[0022]利用所述多级联交叉规则以所述二级联规则集的二级联交叉形式为基础对所述多个待交叉规则进行多级联规则交叉,得到多级联规则交叉的目标规则集。
[0023]优选地,所述利用所述二级联交叉规则对所述多个待交叉规则进行二级联规则交叉,得到两两交叉的二级联规则集,包括:
[0024]根据所述二级联交叉规则对应的规则复合深度将所述多个待交叉规则进行两两交叉,得到待交叉规则两两组合的所有组合方式,其中,所述待交叉规则两两组合的所有组合方式均默认为不相同;
[0025]基于所述二级联交叉规则对应的预设交叉允许操作符将所述待交叉规则两两组合的所有组合方式进行处理,得到所述待交叉规则两两组合的各个组合方式对应的新规则,且集合所述新规则形成两两交叉的二级联规则集。
[0026]优选地,所述利用所述多级联交叉规则以所述二级联规则集的二级联交叉形式为基础对所述多个待交叉规则进行多级联规则交叉,得到多级联规则交叉的目标规则集,包括:
[0027]根据所述多级联交叉规则对应的规则复合深度将所述多个待交叉规则以所述二级联规则集的二级联交叉形式为基础进行多规则交叉,得到待交叉规则多规则组合的所有组合方式,其中,所述待交叉规则多规则组合的所有组合方式均默认为不相同;
[0028]根据所述多级联交叉规则对应的预设交叉允许操作符将所述待交叉规则多规则组合的所有组合方式进行处理,得到所述待交叉规则多规则组合的各个组合方式对应的新规则,且集合所述新规则形成多级联规则交叉的目标规则集。
[0029]优选地,所述预设指标类型包括提升度、准确率、召回率和覆盖率;
[0030]所述利用预设指标过滤规则对所述目标规则集进行规则过滤,得到选中的目标规则,包括:
[0031]根据不同的所述预设指标类型计算所述目标规则集中的每个规则在对应的所述预设指标类型下的得分,且所述目标规则集中的每个规则按照在对应的所述预设指标类型下对应的得分从高到低进行排序;
[0032]根据不同的所述预设指标类型对应的不同预设阈值判断所述目标规则集在对应的所述预设指标类型下是否存在得分大于对应所述预设阈值的目标规则;
[0033]若是,则将大于对应所述预设阈值的目标规则选出,得到选中的目标规则。
[0034]优选地,所述方法还包括:
[0035]利用自动机器学习的自动超参数调优方法对所述数据预处理规则、所述预设抽取规则、所述预设交叉规则和所述预设指标过滤规则的超参数进行进一步优化。
[0036]第二方面,本专利技术提供一种自动规则挖掘装置,所述装置包括:
[0037]获取单元,用于获取单元获取目标数据;
[0038]抽取单元,用于利用不同的预设抽取规则对所述目标数据进行规则抽取,得到多个待交叉规则;
[0039]交叉单元,用于利用预设交叉规则对多个所述待交叉规则进行交叉处理,得到所述预设交叉规则对应的目标规则集;
[0040]过滤单元,用于利用预设指标过滤规则对所述目标规则集进行规则过滤,得到选中的目标规则;
[0041]预测单元,用于将所述选中的目标规则进行汇总,形成分类器,且基于所述目标数据得到预测结果。
[0042]优选地,所述不同的预设抽取规则包括决策树规则、极端随机树规则、K

means规则、随机森林多变量规则和极端随机树多变量规则;所述抽取单元,还用于分别利用所述决策树规则、极端随机树规则、K

means规则本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动规则挖掘方法,其特征在于,所述方法包括:获取目标数据;利用不同的预设抽取规则对所述目标数据进行规则抽取,得到多个待交叉规则;利用预设交叉规则对多个所述待交叉规则进行交叉处理,得到所述预设交叉规则对应的目标规则集;利用预设指标过滤规则对所述目标规则集进行规则过滤,得到选中的目标规则;将所述选中的目标规则进行汇总,形成分类器,且基于所述目标数据得到预测结果。2.根据权利要求1所述的方法,其特征在于,所述不同的预设抽取规则包括决策树规则、极端随机树规则、K

means规则、随机森林多变量规则和极端随机树多变量规则;所述利用不同的预设抽取规则对所述目标数据进行规则抽取,得到多个待交叉规则,包括:分别利用所述决策树规则、极端随机树规则、K

means规则、随机森林多变量规则和极端随机树多变量规则对所述目标数据进行规则抽取,得到所述每个抽取规则对应的待交叉规则。3.根据权利要求2所述的方法,其特征在于,所述预设交叉规则为二级联交叉规则和或多级联交叉规则;所述利用预设交叉规则对多个所述待交叉规则进行交叉处理,得到所述预设交叉规则对应的目标规则集,包括:获取所述多个待交叉规则;当所述预设交叉规则为二级联交叉规则时,利用所述二级联交叉规则对所述多个待交叉规则进行二级联规则交叉,得到两两交叉的二级联规则集,且将所述两两交叉的二级联规则集作为所述目标规则集;当所述预设交叉规则为多级联交叉规则时,利用所述多级联交叉规则对所述多个待交叉规则进行多级联规则交叉,得到多级联规则交叉的目标规则集;当所述预设交叉规则为二级联交叉规则和多级联交叉规则时,利用所述二级联交叉规则对所述多个待交叉规则进行二级联规则交叉,得到两两交叉的二级联规则集;利用所述多级联交叉规则以所述二级联规则集的二级联交叉形式为基础对所述多个待交叉规则进行多级联规则交叉,得到多级联规则交叉的目标规则集。4.根据权利要求3所述的方法,其特征在于,所述利用所述二级联交叉规则对所述多个待交叉规则进行二级联规则交叉,得到两两交叉的二级联规则集,包括:根据所述二级联交叉规则对应的规则复合深度将所述多个待交叉规则进行两两交叉,得到待交叉规则两两组合的所有组合方式,其中,所述待交叉规则两两组合的所有组合方式均默认为不相同;基于所述二级联交叉规则对应的预设交叉允许操作符将所述待交叉规则两两组合的所有组合方式进行处理,得到所述待交叉规则两两组合的各个组合方式对应的新规则,且集合所述新规则形成两两交叉的二级联规则集。5.根据权利要求4所述的方...

【专利技术属性】
技术研发人员:刘凯冯鑫
申请(专利权)人:百融至信北京征信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1