当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于ID3算法的决策树生成方法技术

技术编号:20726002 阅读:37 留言:0更新日期:2019-03-30 17:55
本发明专利技术涉及一种基于ID3算法的决策树生成方法,对ID3算法进行改进,方法如下:利用K‑means++算法将数据集中连续的属性取值离散化,然后计算各个条件属性的重要性SGA(a,P,A),选择重要性大的属性作为分裂点,反复迭代,直到所有条件属性均被用作分裂节点,最终剪枝成决策树。

【技术实现步骤摘要】
一种基于ID3算法的决策树生成方法
本专利技术属于机器学习和数据挖掘

技术介绍
数据挖掘就是对观测到的数据集(经常是庞大的)进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。该定义中所说的“观测到的数据”,是与“实验室得到的”数据相对而言的。一般来说,数据挖掘所处理的数据是为了其他某个目的已经收集好的,而不是为了数据分析本身去收集的。这意味着数据挖掘的目标根本不在数据采集策略。这是数据挖掘区别于大多数统计任务的一个特征,在统计中经常是利用高效率的策略来采集数据以回答特定的问题。数据挖掘就是寻找数据集中的关系,也就是寻找精确、方便并且有价值地总结了数据的某一特征的表示。随着机器学习的普遍深入,数据挖掘已经变得非常重要,而作为数据挖掘中的分类算法之一的决策树也应用的越来越广泛。决策树分类(DecisionTreeClassification)是数据挖掘领域中的重要分支之一。决策树分类学习是以实例数据为基础,通过一组无次序、无规则的实例推理出决策树表示形式的分类规则。如果给定的训练数据集中的数据能准确地反映分析对象的本质,则对应的决策树就能够准本文档来自技高网...

【技术保护点】
1.一种基于ID3算法的决策树生成方法,对ID3算法进行改进,方法如下:利用K‑means++算法将数据集中连续的属性取值离散化,然后计算各个条件属性的重要性SGA(a,P,A),选择重要性大的属性作为分裂点,反复迭代,直到所有条件属性均被用作分裂节点,最终剪枝成决策树。

【技术特征摘要】
1.一种基于ID3算法的决策树生成方法,对ID3算法进行改进,方法如下:利用K-means++算法将数据集中连续的属性取值离散化,然后计...

【专利技术属性】
技术研发人员:王宝亮马明杰
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1