决策树模型的交互式建模方法、装置、设备及存储介质制造方法及图纸

技术编号:23316236 阅读:31 留言:0更新日期:2020-02-11 18:12
本发明专利技术公开了一种决策树模型的交互式建模方法、装置、设备及存储介质,所述方法包括:获取待操作的决策树模型和对决策树模型进行操作的操作任务;根据操作任务对决策树模型进行操作,并根据操作后的决策树模型确定待计算的模型信息;将模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行计算任务;根据各分布式执行机的计算结果得到模型信息,并可视化输出操作后的决策树模型和模型信息。本发明专利技术实现了联合存储有决策树模型训练数据的多个分布式执行机进行决策树模型的交互式建模,从而解决了基于单机的交互式建模方式不能利用海量分布式存储的训练数据进行建模的问题。

Interactive modeling method, device, equipment and storage medium of decision tree model

【技术实现步骤摘要】
决策树模型的交互式建模方法、装置、设备及存储介质
本专利技术涉及人工智能领域,尤其涉及一种决策树模型的交互式建模方法、装置、设备及存储介质。
技术介绍
由于决策树模型具有较好的可解释性,目前决策树模型被广泛应用于诸多领域,如金融机构会使用决策树模型进行风险信贷建模。通常建模的方式并不是单纯的使用机器学习训练生成一颗决策树,而是采用交互式建模型的方式,将决策树模型的建模过程可视化,可以由人工设定节点拆分规则,使得决策树按照预定的规则生长,建模人员通过反复进行交互操作和观察效果,直到得出符合预期的决策树模型。目前常见的交互式建模工具是基于单机运行的,例如广泛使用的SASEM工具,单机运行限制了可处理的数据量大小,无法利用海量的分布式存储的训练数据来进行交互式建模。
技术实现思路
本专利技术的主要目的在于提供一种决策树模型的交互式建模方法、装置、设备及存储介质,旨在解决目前基于单机的交互式建模方式无法利用海量分布式存储的训练数据来进行交互式建模的问题。为实现上述目的,本专利技术提供一种决策树模型的交互式建模方法,所述决策树模型的交互式建模方法包括以下步骤:获取待操作的决策树模型和对所述决策树模型进行操作的操作任务;根据所述操作任务对所述决策树模型进行操作,并根据操作后的决策树模型确定待计算的模型信息;将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务;根据各分布式执行机的计算结果得到所述模型信息,并可视化输出操作后的决策树模型和所述模型信息。可选地,所述获取待操作的决策树模型和对所述决策树模型进行操作的操作任务的步骤包括:接收与本机设备连接的用户端发送的交互操作指令;根据所述交互操作指令从服务器获取待操作的决策树模型,以及根据所述交互操作指令确定对所述决策树模型进行操作的操作任务;根据各分布式执行机的计算结果得到所述模型信息的步骤之后,还包括:将操作后的决策树模型和所述模型信息缓存至所述服务器中;所述可视化输出操作后的决策树模型和所述模型信息的步骤包括:将操作后的决策树模型和所述模型信息返回给所述用户端,以供所述用户端可视化输出操作后的决策树模型和所述模型信息。可选地,当所述操作任务是对所述决策树模型中目标节点的拆分操作、待计算的所述模型信息包括所述拆分操作中拆分规则的拆分增益时,所述将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务的步骤包括:将所述拆分操作中的拆分规则发送给各分布式执行机,以供各分布式执行机计算各自的本地数据在所述拆分规则下的统计信息;所述根据各分布式执行机的计算结果得到所述模型信息的步骤包括:根据各分布式执行机计算得到的所述统计信息计算所述拆分规则的拆分增益。可选地,当待计算的所述模型信息还包括所述目标节点的孩子节点的最优拆分点时,所述根据所述操作任务对所述决策树模型进行操作包括:按照所述拆分规则生成所述目标节点的新孩子节点;所述将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务的步骤还包括:将所述新孩子节点在预设数据特征下各拆分点的数据统计任务发送给各分布式执行机,以供各分布式执行机计算各自本地数据在各所述拆分点下的统计信息;所述根据各分布式执行机的计算结果得到所述模型信息的步骤还包括:接收分布式执行机返回的所述新孩子节点在所述预设数据特征各拆分点下的汇总统计信息;根据所述汇总统计信息计算所述新孩子节点在各所述预设数据特征下的最优拆分点。可选地,所述根据所述汇总统计信息计算所述新孩子节点在各所述预设数据特征下的最优拆分点的步骤包括:将所述新孩子节点在不同的所述预设数据特征下的所述汇总统计信息发送给不同的分布式执行机,以供不同的分布式执行机并行计算所述孩子节点在各所述预设数据特征下的最优拆分点。可选地,所述按照所述拆分规则生成所述目标节点的新孩子节点的步骤之前,还包括:当检测到所述目标节点是非叶子节点时,删除所述决策树模型中所述目标节点当前的孩子节点。可选地,所述根据各分布式执行机的计算结果得到所述模型信息,并可视化输出操作后的决策树模型和所述模型信息的步骤之后,还包括:对操作后的决策树模型计算预设的模型评估指标并可视化输出所述模型评估指标的计算结果。为实现上述目的,本专利技术还提供一种决策树模型的交互式建模装置,所述决策树模型的交互式建模装置包括:获取模块,用于获取待操作的决策树模型和对所述决策树模型进行操作的操作任务;确定模块,用于根据所述操作任务对所述决策树模型进行操作,并根据操作后的决策树模型确定待计算的模型信息;分发模块,用于将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务;输出模块,用于根据各分布式执行机的计算结果得到所述模型信息,并可视化输出操作后的决策树模型和所述模型信息。为实现上述目的,本专利技术还提供一种决策树模型的交互式建模设备,所述决策树模型的交互式建模设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的决策树模型的交互式建模程序,所述决策树模型的交互式建模程序被所述处理器执行时实现如上所述的决策树模型的交互式建模方法的步骤。此外,为实现上述目的,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有决策树模型的交互式建模程序,所述决策树模型的交互式建模程序被处理器执行时实现如上所述的决策树模型的交互式建模方法的步骤。本专利技术中,通过获取待操作的决策树模型和对该决策树模型进行操作的操作任务;根据操作任务对该决策树模型进行操作,并根据操作后的决策树模型确定待计算的模型信息;将该模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行该计算任务;根据各分布式执行机的计算结果得到该模型信息,并可视化输出操作后的决策树模型和该模型信息,实现了联合存储有决策树模型训练数据的多个分布式执行机进行决策树模型的交互式建模,从而解决了基于单机的交互式建模方式不能利用海量分布式存储的训练数据进行建模的问题,使得决策树模型的交互式建模过程能够使用到更多的训练数据,从而提升通过交互式建模方式建立的决策树模型的质量。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图;图2为本专利技术决策树模型的交互式建模方法第一实施例的流程示意图;图3为本专利技术实施例涉及的一种决策树模型的交互式建模系统架构图;图4为本专利技术实施例涉及的一种决策树模型的交互式建模处理流程示意图;图5为本专利技术决策树模型的交互式建模装置较佳实施例的功能示意图模块图。本专利技术目的本文档来自技高网...

【技术保护点】
1.一种决策树模型的交互式建模方法,其特征在于,所述决策树模型的交互式建模方法包括以下步骤:/n获取待操作的决策树模型和对所述决策树模型进行操作的操作任务;/n根据所述操作任务对所述决策树模型进行操作,并根据操作后的决策树模型确定待计算的模型信息;/n将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务;/n根据各分布式执行机的计算结果得到所述模型信息,并可视化输出操作后的决策树模型和所述模型信息。/n

【技术特征摘要】
1.一种决策树模型的交互式建模方法,其特征在于,所述决策树模型的交互式建模方法包括以下步骤:
获取待操作的决策树模型和对所述决策树模型进行操作的操作任务;
根据所述操作任务对所述决策树模型进行操作,并根据操作后的决策树模型确定待计算的模型信息;
将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务;
根据各分布式执行机的计算结果得到所述模型信息,并可视化输出操作后的决策树模型和所述模型信息。


2.如权利要求1所述的决策树模型的交互式建模方法,其特征在于,所述获取待操作的决策树模型和对所述决策树模型进行操作的操作任务的步骤包括:
接收与本机设备连接的用户端发送的交互操作指令;
根据所述交互操作指令从服务器获取待操作的决策树模型,以及根据所述交互操作指令确定对所述决策树模型进行操作的操作任务;
所述根据各分布式执行机的计算结果得到所述模型信息的步骤之后,还包括:
将操作后的决策树模型和所述模型信息缓存至所述服务器中;
所述可视化输出操作后的决策树模型和所述模型信息的步骤包括:
将操作后的决策树模型和所述模型信息返回给所述用户端,以供所述用户端可视化输出操作后的决策树模型和所述模型信息。


3.如权利要求1或2任一项所述的决策树模型的交互式建模方法,其特征在于,当所述操作任务是对所述决策树模型中目标节点的拆分操作、待计算的所述模型信息包括所述拆分操作中拆分规则的拆分增益时,
所述将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务的步骤包括:
将所述拆分操作中的拆分规则发送给各分布式执行机,以供各分布式执行机计算各自的本地数据在所述拆分规则下的统计信息;
所述根据各分布式执行机的计算结果得到所述模型信息的步骤包括:
根据各分布式执行机计算得到的所述统计信息计算所述拆分规则的拆分增益。


4.如权利要求3所述的决策树模型的交互式建模方法,其特征在于,当待计算的所述模型信息还包括所述目标节点的孩子节点的最优拆分点时,
所述根据所述操作任务对所述决策树模型进行操作包括:
按照所述拆分规则生成所述目标节点的新孩子节点;
所述将所述模型信息的计算任务分发给与本机设备连接的各分布式执行机,以供各分布式执行机根据各自的本地数据执行所述计算任务的步骤还包括:
将所述新孩子节点在预设数据特征下各拆分点的数据统计任务发送给各分布式执行机,以供各分布式执行机计算各自...

【专利技术属性】
技术研发人员:李诗琦黄启军唐兴兴林冰垠王跃
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1