【技术实现步骤摘要】
本专利技术涉及一种决策树学习技术,尤其涉及一种决策树优化方法和优化系统。
技术介绍
基于决策树的方法是通过对一组训练数据的学习,构造出决策树形式的知识表 示,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分 支,在决策树叶结点得到结论。所以从根到叶子结点的一条路径就对应着一条规则,整棵决 策树就对应着一组析取表达式规则。基于决策树学习算法的一个最大的优点就是它在学习 过程中不需要使用者了解很多背景知识,其经典的算法有ID3、C4. 5、C5. 0、Cart等。 决策树过于复杂一个原因是因为描述语言的不恰当造成;另一个原因是训练实例 集中可能有噪声。 一般来说系统在进行机器学习时都是建立在一个理想化的假设前提下, 即有充分的训练实例,并且训练实例完全正确,然而事实上训练实例中往往含有噪声数据, 或者训练实例的数量太少,不能产生目标函数有代表性的采样。如果上述情况有一种出现 时,算法所产生的树就会过度拟合训练样例。此外,噪声数据会导致无关实例掺杂在选定的 训练集中,这将引起无谓建模现象。 目前4A(统一帐号、认证、授权、审计)管理系统的智能 ...
【技术保护点】
一种决策树优化方法,其特征在于,包括:查询所述决策树中名称相同且位于同一个父节点下的子树,并存储所述子树;当所述存储的子树为同层重复子树时,合并所述同层重复子树。
【技术特征摘要】
一种决策树优化方法,其特征在于,包括查询所述决策树中名称相同且位于同一个父节点下的子树,并存储所述子树;当所述存储的子树为同层重复子树时,合并所述同层重复子树。2. 根据权利要求1所述的决策树优化方法,其特征在于,所述存储所述子树的操作具 体包括当所述子树为叶子节点时,存储所述子树的节点名称;当所述子树为父节点,其亲子节点为叶子节点时,存储所述子树的节点名称及其所有 亲子节点的名称。3. 根据权利要求2所述的决策树优化方法,其特征在于,所述存储所述子树的操作之 后还包括当所述子树为叶子节点时,比较存储的所述子树的节点名称;当所述子树为父节点,其亲子节点为叶子节点时,比较所述子树的节点名称及其所有 亲子节点的名称。4. 根据权利要求1至3中任意一项所述的决策树优化方法,其特征在于,所述查询所述 决策树中的子树的操作之前还包括存储所述决策树信息,所述决策树信息包括各个节点的ID、节点名称、节点值、节点 标识、层级以及父节点ID。5. 根据权利要求4所述的决策树优化方法,其特征在于,还包括 查找层级相差一级且点名称相同的子树,并存储所述子树; 当所述子树为异层重复子树...
【专利技术属性】
技术研发人员:张世勇,贾殿承,乔辉,武海斌,卢建辉,智韶清,郭林江,狄宏,
申请(专利权)人:中国移动通信集团河北有限公司,
类型:发明
国别省市:13[中国|河北]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。