【技术实现步骤摘要】
本专利技术涉及一种决策树生成算法。特别是涉及一种。
技术介绍
决策树是一种非常直观的知识表示方法,同时也是高效的分类器。目前比较著名的决策树生成算法是Quinlan.J 1986年提出的以信息熵下降速度为启发信息选取节点的ID3算法、C4.5等,然而如何生成较小的树,以及防止数据过拟合等问题,一直是研究的重点。 1.决策树 决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。 决策树有几种产生方法 分类树分析是当预计结果可能为两种类型(例如男女,输赢等)使用的概念。 回归树分析是当局域结果可能为实数(例如房价,患者住院时间等)使用的概念。 CART分析是结合了上述二者的一个概念。CART是Classification AndRegression Trees的缩写. enCHAID(Chi-Square Automatic Interacti ...
【技术保护点】
一种基于概率粗糙集的决策树生成方法,其特征在于,包括如下步骤:1)计算决策属性对于条件属性的依赖度首先设置概率下近似中的β,其中0.5<β≤1,通过使用概率下近似公式,计算每一条件属性Xi,对决策属性Y的概率下近似,然后计算决策属性对条件属性的依赖度,其中概率下近似计算公式如下所示,*↓[β]Y={x∈U|P(Y/[x]↓[Xi])≥β}则Y对X↓[i]依赖度为,γ↓[X↓[i]](Y)=k=|*↓[β]Y|/|U|其中,U代表论域,即全体记录的集合,|U|代表记录的个数;2)对数据进行相对属性约简,获取决策树节点集首先要获得相对核,相对核的计算公式如下,CORE↓[Q]( ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。