树形机器学习模型可视化方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28673664 阅读:32 留言:0更新日期:2021-06-02 02:49
本申请提供一种树形机器学习模型可视化方法、装置、电子设备及存储介质,涉及机器学习技术领域。所述方法包括:获取模型文件;提取所述模型文件的树状结构数据,并将所述树状结构数据组成指定Json格式数据,所述指定Json格式数据中包括所述树状结构数据的节点数据,所述节点数据包括每个节点是否为叶子结点、节点名称以及节点规则;通过D3.js将所述指定Json格式数据在页面进行树形展示和渲染。该方法可以对训练出的模型进行树形结构的解析,形成Json,并使用D3对Json进行加载,把模型进行可视化,以更好地理解模型,提升模型的可解释性。

【技术实现步骤摘要】
树形机器学习模型可视化方法、装置、电子设备及存储介质
本申请涉及机器学习
,具体而言,涉及一种树形机器学习模型可视化方法、装置、电子设备及存储介质。
技术介绍
得益于人工智能技术的快速发展,基于人工智能技术可以解决很多实际的应用问题,如金融领域的风险评估、用户信用评分、用户还款意愿预测、用户资金充裕度预测、用户风险预测和用户疑似代偿识别等。用机器学习算法便可以很好的解决这些应用问题,机器学习算法有很多种,目前在各个领域表现比较好的算法主要是树状模型,如决策树、随机森林、GBDT、Xgboost和Catboost等。这些模型的优势在于其既可以用于回归,也可以用于分类,不需要特征缩放,而且具有比较好的可解释性。可视化的手段不仅是理解模型的好办法,也是向其他人介绍你的模型的运作机制的有利工具。但是如何对树状模型做可视化分析,以便于更多人理解树状模型做决策的机理是一个很有意义的课题。具体地,决策树、随机森林、Xgboost、CatBoost、GBDT模型是最常用的树形机器学习模型,因为这些模型不是黑盒模型,所以它们是可以通过可视化进行理解本文档来自技高网...

【技术保护点】
1.一种树形机器学习模型可视化方法,其特征在于,所述方法包括:/n获取模型文件;/n提取所述模型文件的树状结构数据,并将所述树状结构数据组成指定Json格式数据,所述指定Json格式数据中包括所述树状结构数据的节点数据,所述节点数据包括每个节点是否为叶子结点、节点名称以及节点规则;/n通过D3.js将所述指定Json格式数据在页面进行树形展示和渲染。/n

【技术特征摘要】
1.一种树形机器学习模型可视化方法,其特征在于,所述方法包括:
获取模型文件;
提取所述模型文件的树状结构数据,并将所述树状结构数据组成指定Json格式数据,所述指定Json格式数据中包括所述树状结构数据的节点数据,所述节点数据包括每个节点是否为叶子结点、节点名称以及节点规则;
通过D3.js将所述指定Json格式数据在页面进行树形展示和渲染。


2.根据权利要求1所述的方法,其特征在于,所述获取模型文件,包括:
获取Csv格式的模型训练数据;
根据模型类型设置模型参数;
基于所述模型训练数据和所述模型参数进行模型训练,以获得所述模型文件。


3.根据权利要求2所述的方法,其特征在于,所述基于所述模型训练数据和所述模型参数进行模型训练,包括:
利用Python的文件读取函数read_csv读取所述模型训练数据;
将所述模型训练数据转换为dataFrame格式数据,并提取所述dataFrame格式数据中的特征X和标签列Y;
获取所述模型参数,基于所述模型参数构建模型;
将所述特征X和所述标签列Y代入model.fit函数对所述模型进行训练。


4.根据权利要求1所述的方法,其特征在于,所述提取所述模型文件的树状结构数据,包括:
使用model.estimators_获取所述模型文件中模型的树列表;
基于所述树列表,采用递归方式对所述模型中的每个树进行解析,以获得模型数据,所述模型数据包括树信息、特征、标签和/或树的索引;
将所述模型数据组装为所述树状结构数据。


5.根据权利要求1所述的方法,其特征在于,所述通过D3.js将所述指定Json格式数据在...

【专利技术属性】
技术研发人员:王小东吕文勇周智杰杨军赵小诣
申请(专利权)人:成都新希望金融信息有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1