展示预测模型的方法、装置及调整预测模型的方法、装置制造方法及图纸

技术编号:19694285 阅读:32 留言:0更新日期:2018-12-08 11:48
本发明专利技术公开了一种对预测模型进行展示的方法、装置及调整预测模型的方法、装置。其中,获取预测模型针对至少一个预测样本得到的至少一个预测结果;基于至少一个预测样本和至少一个预测结果来获取用于训练决策树模型的至少一个决策树训练样本,其中,决策树模型用于拟合预测模型;使用至少一个决策树训练样本来训练决策树模型;以及可视化地展示训练出的决策树模型。本发明专利技术可以将难以理解的预测模型近似为决策树模型,并对近似出的决策树模型进行展示,以使得用户基于所展示的决策树模型可以较好地理解预测模型。

【技术实现步骤摘要】
展示预测模型的方法、装置及调整预测模型的方法、装置本申请是申请日为2016年4月27日、申请号为201610269127.2、题为“展示预测模型的方法、装置及调整预测模型的方法、装置”的专利申请的分案申请。
本专利技术涉及数据科学领域,特别是涉及一种对预测模型进行展示的方法、装置及调整预测模型的方法、装置。
技术介绍
在传统的数据挖掘方式中,往往利用统计的方法对历史数据进行回归分析或因子分析,进而剖析历史数据的成因,并利用得到的规律组建决策引擎。统计学习理论中,结构化风险等于经验风险与置信风险的总和。其中,经验风险是学习获取的知识在给定的样本集上的误差,而置信风险是知识在未知样本上的误差。因此,传统的统计方法仅仅做到了在已知样本上的风险最小化,无法保证在未知样本上置信风险的抑制。也就是说,从统计学习的角度来看,这种方式仅仅做到了统计,并未真正有效地从历史数据中学习出知识。近年来,随着大数据、云计算和人工智能等技术的发展,机器学习被广泛地用来从海量数据挖掘出其中隐藏的有用信息。关于统计学习与机器学习的区别已经有不少讨论,很大程度上认为机器学习侧重于目标预测,而统计学习侧重于模型的可解释本文档来自技高网...

【技术保护点】
1.一种对预测模型进行展示的方法,包括:获取预测模型针对至少一个预测样本得到的至少一个预测结果;基于所述至少一个预测样本和所述至少一个预测结果来获取用于训练决策树模型的至少一个决策树训练样本,其中,所述决策树模型用于拟合所述预测模型;使用所述至少一个决策树训练样本来训练决策树模型;以及可视化地展示训练出的决策树模型。

【技术特征摘要】
1.一种对预测模型进行展示的方法,包括:获取预测模型针对至少一个预测样本得到的至少一个预测结果;基于所述至少一个预测样本和所述至少一个预测结果来获取用于训练决策树模型的至少一个决策树训练样本,其中,所述决策树模型用于拟合所述预测模型;使用所述至少一个决策树训练样本来训练决策树模型;以及可视化地展示训练出的决策树模型。2.根据权利要求1所述的方法,其中,在基于所述至少一个预测样本和所述至少一个预测结果来获取用于训练决策树模型的至少一个决策树训练样本的步骤中,将所述预测样本的至少一部分特征作为所述决策树训练样本的特征,并基于相应得到的预测结果来获取所述决策树训练样本的标记;或者在基于所述至少一个预测样本和所述至少一个预测结果来获取用于训练决策树模型的至少一个决策树训练样本的步骤中,对所述预测样本的至少一部分特征进行变换,将变换后的所述至少一部分特征作为所述决策树训练样本的特征,并基于相应得到的预测结果来获取所述决策树训练样本的标记。3.根据权利要求2所述的方法,其中,对所述预测样本的所述至少一部分特征进行变换的步骤包括:将所述预测样本的所述至少一部分特征之中的至少一个特征子集分别变换为相应的至少一个变换特征子集。4.根据权利要求3所述的方法,其中,变换前的特征子集指示预测样本的属性信息,相应的变换特征子集指示所述属性信息的统计信息或权重信息。5.根据权利要求2所述的方法,其中,对所述预测样本的至少一部分特征进行变换的步骤包括:将所述预测样本的所述至少一部分特征之中的至少一个离散化特征子集变换为相应的至少一个连续特征。6.根据权利要求5所述的方法,其中,所述离散化特征子集指示预测样本的属性信息,其中,相应的连续特征指示所述属性信息关于预测模型的预测目标的统计信息;或者,相应的连续特征指示所述属性信息关于预测模型的预测目标的预测权重。7.一种调整预测模型的方法,包括:使用权利要求1至6中任何一项所述的...

【专利技术属性】
技术研发人员:白杨陈雨强戴文渊
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1