基于可解释性随机森林的可视化系统及方法技术方案

技术编号:29227979 阅读:38 留言:0更新日期:2021-07-10 01:15
本发明专利技术公开了基于可解释性随机森林的可视化系统及方法,该系统包括数据模块、可视化模块、渲染模块和交互模块;所述数据模块,用于对训练集数据和模型数据进行存储、提取、统计及分析;所述可视化模块,用于对数据模块中存储的数据信息进行可视化算法映射,并经过编码后生成由空间和时序组成的几何图形结构;所述渲染模块,用于对可视化模块生成的几何图形结构进行输出,并在交互模块中的屏幕以实际的像素点进行显示。本发明专利技术能够多维度、多角度地分析和理解对特征样本的预测,并且能对随机森林模型从数据、特征、树和路径结构以及预测结果角度的进行展示分析,从而提高了随机森林模型的可解释性。的可解释性。的可解释性。

【技术实现步骤摘要】
基于可解释性随机森林的可视化系统及方法


[0001]本专利技术涉及大数据机器学习
,特别是基于可解释性随机森林的可视化系统及方法。

技术介绍

[0002]机器学习中的随机森林模型是由多棵决策树构成的集成学习器,他采取投票的方式进行决策。树的数量多以及结构的复杂造成了随机森林是十分难以理解的。由于随机森林优异的性能,他在医疗、运营等领域决策事件中可以取得非常好的预测成绩,但是它的结构的可解释性却很糟糕,如何将随机森林模型清晰且易懂地展示给用户成为了迫切的需求。
[0003]现有的应用随机森林预测的系统存在不能多维度、多角度地分析和理解对特征样本的预测,并且不能对随机森林模型从数据、特征、树和路径结构以及预测结果角度的展示分析,导致随机森林模型的可解释性效果较差。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的不足,提供一种基于可解释性随机森林的可视化系统及方法,以解决现有随机森林存在不能多维度、多角度地分析和理解对特征样本的预测,并且不能对随机森林模型从数据、特征、树和路径结构以及预测结果角度的展示分析本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于可解释性随机森林的可视化系统,其特征在于:包括数据模块、可视化模块、渲染模块和交互模块;所述数据模块,用于对训练集数据和模型数据进行存储、提取、统计及分析;所述可视化模块,用于对数据模块中存储的数据信息进行可视化算法映射,并经过编码后生成由空间和时序组成的几何图形结构;所述渲染模块,用于对可视化模块生成的几何图形结构进行输出,并在交互模块中的屏幕以实际的像素点进行显示;所述交互模块,用于显示渲染模块生成的数据,支持用户触摸点选对数据进行筛选和详情查看;所述数据模块包括:数据分析模块,用于训练集数据和模型数据的展示,形成数据信息视图;森林分析模块,用于分析随机森林的结构、树的结构、路径信息和结点并形成森林数据视图;特征分析模块,用于对特征进行分析并形成特征视图;个体学习器分析模块,用于对随机森林中的个体进行分析并形成个体信息视图。2.根据权利要求1所述的基于可解释性随机森林的可视化系统,其特征在于:所述数据信息视图包括用于显示模型数据预测能力数据指标的巢状饼图、用于显示训练集数据降维后的降维散点图和用于显示训练集数据原始数据信息的数据信息表格。3.根据权利要求1所述的基于可解释性随机森林的可视化系统,其特征在于:所述森林数据视图为森林旭日图。4.根据权利要求1所述的基于可解释性随机森林的可视化系统,其特征在于:所述特征视图包括用于显示特征重要性的特征重要性视图,用于显示特征分割点分布和特征统计信息的特征分析视图。5.根据权利要求1所述的基于可解释性随机森林的可视化系统,其特征在于:所述个体信息视图包括用于显示个体性能的个体...

【专利技术属性】
技术研发人员:蒲剑苏张婷婷夏瑜潞邵慧张景文
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1