当前位置: 首页 > 专利查询>天津大学专利>正文

基于概率粗糙集的决策树生成方法技术

技术编号:4002647 阅读:299 留言:0更新日期:2012-04-11 18:40
一种基于概率粗糙集的决策树生成方法,步骤为:1)计算决策属性对于条件属性的依赖度;2)对数据进行相对属性约简,获取决策树节点集;3)通过决策树的节点集构造决策树,建立决策树的方式是,让依赖度最大的节点作为根节点,然后对于分支,重新计算剩余节点的依赖度信息,同时选择依赖度最大的节点。本发明专利技术最核心的思想就是首先通过相对约简消除没有用的属性,这样就可以得到用于生成决策树的节点。然后始终选择依赖度最大的节点来扩展生成树,最终就生成了我们需要的决策树。本发明专利技术能够有效的解决数据噪声问题。

【技术实现步骤摘要】

本专利技术涉及一种决策树生成算法。特别是涉及一种。
技术介绍
决策树是一种非常直观的知识表示方法,同时也是高效的分类器。目前比较著名的决策树生成算法是Quinlan.J 1986年提出的以信息熵下降速度为启发信息选取节点的ID3算法、C4.5等,然而如何生成较小的树,以及防止数据过拟合等问题,一直是研究的重点。 1.决策树 决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。 决策树有几种产生方法 分类树分析是当预计结果可能为两种类型(例如男女,输赢等)使用的概念。 回归树分析是当局域结果可能为实数(例如房价,患者住院时间等)使用的概念。 CART分析是结合了上述二者的一个概念。CART是Classification AndRegression Trees的缩写. enCHAID(Chi-Square Automatic Interaction Detecto本文档来自技高网...

【技术保护点】
一种基于概率粗糙集的决策树生成方法,其特征在于,包括如下步骤:1)计算决策属性对于条件属性的依赖度首先设置概率下近似中的β,其中0.5<β≤1,通过使用概率下近似公式,计算每一条件属性Xi,对决策属性Y的概率下近似,然后计算决策属性对条件属性的依赖度,其中概率下近似计算公式如下所示,*↓[β]Y={x∈U|P(Y/[x]↓[Xi])≥β}则Y对X↓[i]依赖度为,γ↓[X↓[i]](Y)=k=|*↓[β]Y|/|U|其中,U代表论域,即全体记录的集合,|U|代表记录的个数;2)对数据进行相对属性约简,获取决策树节点集首先要获得相对核,相对核的计算公式如下,CORE↓[Q](P)=∩RED↓[Q...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘江林利
申请(专利权)人:天津大学
类型:发明
国别省市:12[中国|天津]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1