System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 随机森林模型的处理方法、系统、介质及设备技术方案_技高网

随机森林模型的处理方法、系统、介质及设备技术方案

技术编号:40580945 阅读:5 留言:0更新日期:2024-03-06 17:24
本申请公开了一种随机森林模型的处理方法、系统、介质及设备,方法包括:获取用于分类任务的源随机森林模型;将源随机森林模型转换为逻辑表达式,得到源随机森林模型对应的逻辑公式集合;其中,逻辑公式集合与源随机森林模型的逻辑等价;对逻辑公式集合中存在的冗余逻辑公式进行简化处理,得到源随机森林模型对应的解释集。由于本申请抽取源随机森林模型的逻辑表达式进行简化处理,实现了将黑盒的随机森林预测模型解释成为一个精炼的、包含若干决策规则的解释集,该解释集同样也可以用来预测,其预测能力与源模型相近,从而降低了模型的参数,提升了模型的运行效率。

【技术实现步骤摘要】

本申请涉及人工智能领域,尤其涉及深度学习,特别涉及一种随机森林模型的处理方法、系统、介质及设备


技术介绍

1、随着人工智能的发展与进步,人工智能相关技术渐渐深入各行各业以及我们的生活,并在多领域取得了巨大的成果。但随之而来的是可靠、安全等问题,人工智能技术是否值得信任引起了领域专家的关注。

2、机器学习技术虽然在多领域取得巨大成功,但是它的缺点就是模型规模庞大复杂,难以理解其内部的结构以及预测逻辑。对机器学习的模型进行可解释性研究尚处于起步阶段,有大量的技术问题有待解决。

3、决策树模型是一种机器学习算法,它本身在一定程度上已然趋近于一个“白盒”模型,但也仅限于单棵树且树深度不高时。随即森林模型是一种经典的机器学习技术,它包含多棵决策树以获得更好的预测效果。在实际应用中,集成树模型通常拥有大量的决策树,且树的规模都很大,这样复杂庞大的模型难以直接给出比较适用的解释,模型庞大的参数影响了其运行效率。


技术实现思路

1、本申请实施例提供了一种随机森林模型的处理方法、系统、介质及设备。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。

2、第一方面,本申请实施例提供了一种随机森林模型的处理方法,方法包括:

3、获取用于分类任务的源随机森林模型;

4、将源随机森林模型转换为逻辑表达式,得到源随机森林模型对应的逻辑公式集合;其中,逻辑公式集合与源随机森林模型的逻辑等价;

5、对逻辑公式集合中存在的冗余逻辑公式进行简化处理,得到源随机森林模型对应的解释集。

6、可选的,将源随机森林模型转换为逻辑表达式,得到源随机森林模型对应的逻辑公式集合,包括:

7、遍历源随机森林模型的每棵树中每条分支上所有节点的合取式;

8、遍历源随机森林模型的每棵树中每条分支所关联的叶子结点上的投票分布;

9、将每条分支上所有节点的合取式至每条分支所关联的叶子结点的投票分布的一条逻辑公式作为每条分支的逻辑公式;其中,

10、合取式为每条分支上所有节点公式或者公式的否定的合取式。

11、可选的,对逻辑公式集合中存在的冗余逻辑公式进行简化处理,包括:

12、基于预设分支质量公式和预设节点质量公式,对源随机森林模型的每棵树中每条分支及每条分支上的节点进行删除;

13、将逻辑公式集合中关于同一个特征的合取项进行合并;

14、对逻辑公式集合进行分组以及参数过滤。

15、可选的,基于预设分支质量公式和预设节点质量公式,对源随机森林模型的每棵树中每条分支及每条分支上的节点进行删除,包括:

16、基于预设分支质量公式,计算源随机森林模型的每棵树中每条分支的第一质量;

17、将计算的第一质量小于预设质量阈值的分支进行删除;

18、基于预设节点质量公式,计算源随机森林模型的每棵树中每条分支上每个结点的第二质量;

19、将计算的第二质量小于预设质量阈值的节点删除;其中,

20、预设分支质量公式为:

21、

22、其中,r是每棵树中需要处理的目标分支,m是类别数量,h(lr)是该分支叶子结点的熵,acc为该分支所在树的分类准确度,计算每条分支的质量,并将质量低于分支过滤参数φ的分支删除;

23、结点质量公式为:

24、qn(n)=ig(n);

25、其中,n为目标结点,ig(n)为结点n的信息增益,计算每个结点的质量,并将小于结点过滤参数θ的结点删除。

26、可选的,对逻辑公式集合进行分组以及参数过滤,包括:

27、计算源随机森林模型的每棵树中每条分支的逻辑公式的类签名;

28、根据每条分支的逻辑公式的类签名,将拥有相同类签名的逻辑公式划分到同一个组中,得到多组不同类型的逻辑公式;

29、计算源随机森林模型的每棵树中每条分支的逻辑公式的权重;

30、根据每条分支的逻辑公式的权重,对各组不同类型的逻辑公式保留权重大于k的分支公式,k为规模过滤参数。

31、可选的,计算源随机森林模型的每棵树中每条分支的逻辑公式的类签名,包括:

32、根据预设叶子合并参数,将每条分支所关联的叶子结点的投票分布转换为概率分布,得到每条分支所关联的叶子结点的概率分布;

33、将每条分支所关联的叶子结点的概率分布作为每条分支的逻辑公式的类签名;其中,

34、转换公式如下:

35、

36、其中,(n1,…,nm)为给定一个分支r的叶子结点的投票分布,m是类别的数量,(ξ1,…,ξm)为将投票分布转换后的概率分布,为分支公式r的类签名。

37、可选的,计算源随机森林模型的每棵树中每条分支的逻辑公式的权重,包括:

38、对每条分支所关联的叶子结点的投票分布进行求和,得到每条分支的总和;

39、将每条分支的总和作为每条分支的逻辑公式的权重;其中,

40、求和公式为:

41、

42、其中,(n1,…,nm)为给定一个分支r的叶子结点的投票分布,m是类别的数量,a为分支公式r的权重。

43、第二方面,本申请实施例提供了一种随机森林模型的处理系统,系统包括:

44、模型获取模块,用于获取用于分类任务的源随机森林模型;

45、逻辑表达式转换模块,用于将源随机森林模型转换为逻辑表达式,得到源随机森林模型对应的逻辑公式集合;其中,逻辑公式集合与源随机森林模型的逻辑等价;

46、逻辑公式集合简化模块,用于对逻辑公式集合中存在的冗余逻辑公式进行简化处理,得到源随机森林模型对应的解释集。

47、第三方面,本申请实施例提供一种计算机存储介质,计算机存储介质存储有多条指令,指令适于由处理器加载并执行上述的方法步骤。

48、第四方面,本申请实施例提供一种设备,可包括:处理器和存储器;其中,存储器存储有计算机程序,计算机程序适于由处理器加载并执行上述的方法步骤。

49、本申请实施例提供的技术方案可以包括以下有益效果:

50、在本申请实施例中,随机森林模型的处理系统首先获取用于分类任务的源随机森林模型;然后将源随机森林模型转换为逻辑表达式,得到源随机森林模型对应的逻辑公式集合;其中,逻辑公式集合与源随机森林模型的逻辑等价;最后对逻辑公式集合中存在的冗余逻辑公式进行简化处理,得到源随机森林模型对应的解释集。由于本申请抽取源随机森林模型的逻辑表达式进行简化处理,实现了将黑盒的随机森林预测模型解释成为一个精炼的、包含若干决策规则的解释集,该解释集同样也可以用来预测,其预测能本文档来自技高网...

【技术保护点】

1.一种随机森林模型的处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述源随机森林模型转换为逻辑表达式,得到所述源随机森林模型对应的逻辑公式集合,包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述逻辑公式集合中存在的冗余逻辑公式进行简化处理,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于预设分支质量公式和预设节点质量公式,对所述源随机森林模型的每棵树中每条分支及每条分支上的节点进行删除,包括:

5.根据权利要求3所述的方法,其特征在于,所述对所述逻辑公式集合进行分组以及参数过滤,包括:

6.根据权利要求5所述的方法,其特征在于,所述计算所述源随机森林模型的每棵树中每条分支的逻辑公式的类签名,包括:

7.根据权利要求5所述的方法,其特征在于,所述计算所述源随机森林模型的每棵树中每条分支的逻辑公式的权重,包括:

8.一种随机森林模型的处理系统,其特征在于,所述系统包括:

9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-7任意一项所述的方法。

10.一种设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1-7任意一项所述的方法。

...

【技术特征摘要】

1.一种随机森林模型的处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述源随机森林模型转换为逻辑表达式,得到所述源随机森林模型对应的逻辑公式集合,包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述逻辑公式集合中存在的冗余逻辑公式进行简化处理,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于预设分支质量公式和预设节点质量公式,对所述源随机森林模型的每棵树中每条分支及每条分支上的节点进行删除,包括:

5.根据权利要求3所述的方法,其特征在于,所述对所述逻辑公式集合进行分组以及参数过滤,包括:

6.根据权...

【专利技术属性】
技术研发人员:黄滟鸿史建琦张格林任建鹏
申请(专利权)人:上海丰蕾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1