一种组合规则生成方法技术

技术编号:39817645 阅读:13 留言:0更新日期:2023-12-22 19:36
本发明专利技术公开了一种组合规则生成方法

【技术实现步骤摘要】
一种组合规则生成方法、装置、电子设备及存储介质


[0001]本专利技术涉及信息
,尤其涉及一种组合规则生成方法

装置

电子设备及存储介质


技术介绍

[0002]在电子商务

数据处理

金融等多种业务场景下,经常会遇到需要从大量的样本中筛选目标样本的问题,例如客户群体的圈定

多媒体数据的查找等

为此,规则生成方法应运而生

[0003]规则生成方法是指基于给定的历史样本
(
包括目标历史样本和非目标历史样本
)
挖掘规则的方法,通过该规则可以从历史样本中准确的找出目标历史样本,从而使得该规则能够用于后续样本的筛选

现有的规则生成方法通常分为两种:一种是采用统计指标对历史样本进行分位数划分,进而根据位于分位数左右的样本来构造规则;另一种是采用规则拟合算法生成规则

[0004]然而,上述第一种方法需要通过人工来实现,并且仅适用于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种组合规则生成方法,其特征在于,包括:根据当前业务的训练集,确定多个原始规则;其中,所述训练集包括若干个非目标训练样本以及若干个目标训练样本;针对每个所述原始规则,根据所述若干个非目标训练样本以及所述若干个目标训练样本中未能被所述原始规则识别的目标训练样本,确定所述原始规则对应的关联规则;从所述多个原始规则对应的关联规则中,确定目标关联规则;若不满足迭代终止条件,则将所述目标关联规则作为新的原始规则,返回执行“针对每个所述原始规则,根据所述若干个非目标训练样本以及所述若干个目标训练样本中未能被所述原始规则识别的目标训练样本,确定所述原始规则对应的关联规则”的步骤;若满足迭代终止条件,则针对每个所述目标关联规则进行溯源,确定目标组合规则
。2.
根据权利要求1所述的方法,其特征在于,所述针对每个所述目标关联规则进行溯源,确定目标组合规则,包括:针对每个所述目标关联规则进行溯源,得到所述目标关联规则对应的新的原始规则以及所述目标关联规则对应的原始规则;将所述目标关联规则

所述目标关联规则对应的新的原始规则以及所述目标关联规则对应的原始规则,确定为所述目标组合规则
。3.
根据权利要求1所述的方法,其特征在于,所述根据所述若干个非目标训练样本以及所述若干个目标训练样本中未能被所述原始规则识别的目标训练样本,确定所述原始规则对应的关联规则,包括:将所述若干个非目标训练样本以及所述若干个目标训练样本中未能被所述原始规则识别的目标训练样本输入规则拟合算法,得到所述原始规则对应的关联规则
。4.
根据权利要求1所述的方法,其特征在于,所述从所述多个原始规则对应的关联规则中,确定目标关联规则,包括:对每个所述关联规则进行溯源,得到所述关联规则对应的新的原始规则以及所述原始规则,并将所述关联规则

所述关联规则对应的新的原始规则以及所述原始规则作为所述关联规则对应的中间组合规则;针对每个所述中间组合规则,将所述中间组合规则作为约束条件与所述当前业务的训练集进行匹配,确定所述中间组合规则的评价参数;根据多个所述关联规则对应的中间组合规则的评价参数,从所述多个原始规则对应的关联规则中确定所述目标关联规则;其中,所述目标关联规则为对应的中间组合规则的评价参数位于前预设数量的关联规则
。5.
根据权利要求4所述的方法,其特征在于,所述中间组合规则的评价参数包括如下至少之一:中间组合规则的召回率

中间组合规则的准确率以及中间组合规则的性价比值
。6.
根据权利要求5所述的方法,其特征在于,每个所述训练样本包括:至少一个特征对应的特征信息;当所述中间组合规则的评价参数包括中间组合规则的召回率

中间组合规则的准确率以及中间组合规则的性价比值时,所述将所述中间组合规则作为约束条件与所述当前业务的训练集进行匹配,确定所述中间组合规则的评价参数,包括:根据所述若干个目标训练样本的特征信息,确定所述中间组合规则的召回样本数;其
中,所述中间组合规则的召回样本数为所述特征信息符合所述中间组合规则的目标训练样本的数量;根据所述训练样本的特征信息,确定所述中间组合规则的规则识别样本数;其中,所述中间组合规则的规则识别样本数为所述特征信息符合所述中间组合规则的训练样本的数量;根据所述中间组合规则的召回样本数和所述训练集中的目标训练样本的数量,确定所述中间组合规则的召回率;根据所述中间组合规则的召回样本数和所述中间组合规则的规则识别样本数,确定所述中间组合规则的准确率;根据所述中间组合规则的召回样本数

所述中间组合规则的规则识别样本数以及所述训练集中的目标训练样本的数量,确定所述中间组合规则的性价比值
。7.
根据权利要求6所述的方法,其特征在于,所述根据所述中间组合规则的召回样本数和所述训练集中的目标训练样本的数量,确定所述中间组合规则的召回率,包括:将所述中间组合规则的召回样本数和所述训练集中的目标训练样本的数量的比值,确定为所述中间组合规则的召回率;所述根据所述中间组合规则的召回样本数和所述中间组合规则的规则识别样本数,确定所述中间组合规则的准确率,包括:将所述中间组合规则的召回样本数和所述中间组合规则的规则识别样本数的比值,确定为所述中间组合规则的准确率;所...

【专利技术属性】
技术研发人员:张涛周斌孙鑫焱
申请(专利权)人:上海识装信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1