基于优化规则决策树的目标安全识别方法、装置及电子设备制造方法及图纸

技术编号:35508833 阅读:12 留言:0更新日期:2022-11-09 14:22
本申请涉及一种基于优化规则决策树的目标安全识别方法、装置、电子设备及计算机可读介质。该方法包括:通过规则决策树的底层逻辑数据生成所述逻辑字符串之间的关系;基于所述逻辑字符串之间的关系生成规则结构图;依据所述规则结构图分别确定所述逻辑字符串之间的关系重要度;分析所述逻辑字符串之间的关系重要度对所述规则决策树进行优化,通过优化后的所述规则决策树对待识别目标的目标数据进行识别,根据识别结果对所述待识别目标进行安全分级。本申请能够对复杂的规则决策树进行简化,提高业务决策效率,保证业务数据安全;还能够在业务数据出现错误时,快速计算影响程度,保证业务运行安全。保证业务运行安全。保证业务运行安全。

【技术实现步骤摘要】
基于优化规则决策树的目标安全识别方法、装置及电子设备


[0001]本申请涉及计算机信息处理领域,具体而言,涉及一种基于优化规则决策树的目标安全识别方法、装置、电子设备及计算机可读介质。

技术介绍

[0002]现有的规则决策树,因为人群较大,分类较多,所以流程的分支、分支上的节点以及节点下的规则和模型也非常多,导致整个结构都非常庞大。
[0003]也正是因为规则决策树的结构复杂,在日常更新风控策略的时候怕影响其他分支导致最终出现较坏的影响,所以一般情况下只会给规则决策树填加规则,很少会减少规则。长此以往,规则决策树越来越复杂,后期维护会十分麻烦。而且,在规则决策树在业务系统中上线运行时,一旦某个数据源出现问题,造成业务错误,需要进行错误定位时,工程师需要去测试所有用到该数据源的模型,重新进行打分测试评估,十分耗费时间和精力。
[0004]因此,需要一种新的基于优化规则决策树的目标安全识别方法、装置、电子设备及计算机可读介质。
[0005]在所述
技术介绍
部分公开的上述信息仅用于加强对本申请的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]有鉴于此,本申请提供一种基于优化规则决策树的目标安全识别方法、装置、电子设备及计算机可读介质,能够对复杂的规则决策树进行简化,提高业务决策效率,保证业务数据安全;还能够在业务数据出现错误时,快速计算影响程度,保证业务运行安全。
[0007]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0008]根据本申请的一方面,提出一种基于优化规则决策树的目标安全识别方法,该方法包括:通过规则决策树各节点的底层逻辑数据分别生成对应的逻辑字符串;根据规则决策树的树状结构确定所述逻辑字符串之间的关系;基于所述逻辑字符串之间的关系生成规则结构图;依据所述规则结构图分别确定所述逻辑字符串之间的关系重要度;分析所述逻辑字符串之间的关系重要度对所述规则决策树进行优化,通过优化后的所述规则决策树对待识别目标的目标数据进行识别,根据识别结果对所述待识别目标进行安全分级。
[0009]可选地,通过规则决策树的底层逻辑数据生成所述逻辑字符串之间的关系,包括:通过python语言对所述规则决策树的底层逻辑数据进行重写解析;在重写解析的过程中,由规则决策树的各节点中提取非结构化规则数据;通过非结构化规则数据生成所述逻辑字符串。
[0010]可选地,根据规则决策树的树状结构确定所述逻辑字符串之间的关系,包括:根据规则决策树的树状结构提取非结构化规则数据之间的关系以作为所述逻辑字符串之间的关系。
[0011]可选地,基于所述逻辑字符串之间的关系生成规则结构图,包括:将逻辑字符串作为规则结构图中的节点;将逻辑字符串之间的关系作为多个节点之间的边;通过节点和边生成所述规则结构图。
[0012]可选地,依据所述规则结构图分别确定所述逻辑字符串之间的关系重要度,包括:获取训练后的机器学习模型和其对应的样本集,所述样本集中包括多个样本数据,每个样本数据包括多个特征;生成多个特征对应的特征重要度;根据所述规则结构图的图结构和多个特征对应的特征重要度确定所述逻辑字符串之间的关系重要度。
[0013]可选地,生成多个特征对应的特征重要度,包括:生成所述机器学习模型在所述样本集上的初始性能分;生成多个特征对应的特征性能评分;根据所述初始能评分和多个特征性能评分生成多个特征重要度。
[0014]可选地,生成多个特征对应的特征性能评分,包括:依次提取所述样本集合的多个特征中的一个特征;将所述样本集中的所述特征进行随机重排生成随机样本集;生成所述机器学习模型在所述随机样本集上的对应于所述特征的特征性能评分。
[0015]可选地,根据所述规则结构图的图结构和多个特征对应的特征重要度确定所述逻辑字符串之间的关系重要度,包括:根据所述规则结构图的图结构确定所述逻辑字符串之间关系的结构重要度;根据多个特征对应的特征重要度确定所述逻辑字符串之间关系的特征重要度;根据所述结构重要度和所述特征重要度生成所述逻辑字符串之间的关系重要度。
[0016]可选地,分析所述逻辑字符串之间的关系重要度对所述规则决策树进行优化,包括:根据所述逻辑字符串之间的关系重要度对所述规则结构图中的节点和边进行化简;根据化简之后的所述规则结构图生成优化规则决策树。
[0017]可选地,根据化简之后的所述规则结构图生成优化规则决策树,包括:根据化简之后的所述规则结构图生成化简规则决策树;对所述化简规则决策书中的参数进行更新;通过更新后的参数和化简规则决策树生成所述优化规则决策树。
[0018]根据本申请的一方面,提出一种基于优化规则决策树的目标安全识别装置,该装置包括:字符模块,用于通过规则决策树各节点的底层逻辑数据分别生成对应的逻辑字符串;关系模块,用于根据规则决策树的树状结构确定所述逻辑字符串之间的关系;结构模块,用于基于所述逻辑字符串之间的关系生成规则结构图;重要度模块,用于依据所述规则结构图分别确定所述逻辑字符串之间的关系重要度;优化模块,用于分析所述逻辑字符串之间的关系重要度对所述规则决策树进行优化;识别模块,用于通过优化后的所述规则决策树对待识别目标的目标数据进行识别,根据识别结果对所述待识别目标进行安全分级。
[0019]根据本申请的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
[0020]根据本申请的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
[0021]根据本申请的基于优化规则决策树的目标安全识别方法、装置、电子设备及计算机可读介质,通过通过规则决策树的底层逻辑数据生成所述逻辑字符串之间的关系;基于所述逻辑字符串之间的关系生成规则结构图;依据所述规则结构图分别确定所述逻辑字符
串之间的关系重要度;分析所述逻辑字符串之间的关系重要度对所述规则决策树进行优化,通过优化后的所述规则决策树对待识别目标的目标数据进行识别,根据识别结果对所述待识别目标进行安全分级的方式,能够对复杂的规则决策树进行简化,提高业务决策效率,保证业务数据安全;还能够在业务数据出现错误时,快速计算影响程度,保证业务运行安全。
[0022]应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
[0023]通过参照附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是根据一示例性实施例示出的一种基于优化规则决策树的目标安全识别方法及装置的系统框图。
[0025]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于优化规则决策树的目标安全识别方法,其特征在于,包括:通过规则决策树各节点的底层逻辑数据分别生成对应的逻辑字符串;根据规则决策树的树状结构确定所述逻辑字符串之间的关系;基于所述逻辑字符串之间的关系生成规则结构图;依据所述规则结构图分别确定所述逻辑字符串之间的关系重要度;分析所述逻辑字符串之间的关系重要度对所述规则决策树进行优化;通过优化后的所述规则决策树对待识别目标的目标数据进行识别,根据识别结果对所述待识别目标进行安全分级。2.如权利要求1所述的方法,其特征在于,通过规则决策树各节点的底层逻辑数据分别生成对应的逻辑字符串,包括:通过python语言对所述规则决策树的底层逻辑数据进行重写解析;在重写解析的过程中,由规则决策树的各节点中提取非结构化规则数据;通过非结构化规则数据生成所述逻辑字符串。3.如权利要求2所述的方法,其特征在于,根据规则决策树的树状结构确定所述逻辑字符串之间的关系,包括:根据规则决策树的树状结构提取非结构化规则数据之间的关系以作为所述逻辑字符串之间的关系。4.如权利要求1所述的方法,其特征在于,基于所述逻辑字符串之间的关系生成规则结构图,包括:将逻辑字符串作为规则结构图中的节点;将逻辑字符串之间的关系作为多个节点之间的边;通过节点和边生成所述规则结构图。5.如权利要求1所述的方法,其特征在于,依据所述规则结构图分别确定所述逻辑字符串之间的关系重要度,包括:获取训练后的机器学习模型和其对应的样本集,所述样本集中包括多个样本数据,每个样本数据包括多个特征;生成多个特征对应的特征重要度;根据所述规则结构图的图结构和多个特征对应的特征重要度确定所述逻辑字符串之间的关系重要度。6.如权利要求5所述的方法,其特征在于,生成多个特征对应的特征重要度,包括:生成所述机器学习模型在所述样本集上的初始性能分;生成多个特征对应的特征性能评分;根据所述初始能评分和多个特征性能评分生成多个特征重要度。7.如权利要求6所述的方法,其特征在于,生成多个特征对应的特征性能评分,包括:依次提取所述样本集合的多个特征中的一个特征;将所述样本集中的所述特征进行随机重排生成随机样本集;...

【专利技术属性】
技术研发人员:鲁文娜王垚炜沈赟
申请(专利权)人:上海淇玥信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1