当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于深度强化学习的不平衡分类决策树生成方法技术

技术编号:29202377 阅读:33 留言:0更新日期:2021-07-10 00:37
本发明专利技术提供一种基于深度强化学习的不平衡分类决策树生成方法,包括以下步骤:步骤(1):数据预处理;对数据集D包含特征进行依次编号,同时把数据集归一化到[0,1]区间并且提取每个特征的p分位数;步骤(2):决策树生成过程的状态空间表示;对决策树中的决策节点以及决策树整体进行向量表示;步骤(3):决策树生成过程的动作空间表示;把决策树生成过程中节点位置选择、节点操作选择、划分特征选择以及划分阈值选择对应到马尔可夫决策过程中的动作空间;步骤(4):利用常见的不平衡分类评估指标设计奖励函数;步骤(5):把决策树生成过程建模成标准的马尔可夫决策过程,并运用已有的深度强化学习算法进行求解最优生成策略和决策树结构。结构。结构。

【技术实现步骤摘要】
一种基于深度强化学习的不平衡分类决策树生成方法


[0001]本专利技术属于机器学习领域,涉及一种用于不平衡分类的决策树生成方法,可适用于数据偏斜、特征连续情况下的二分类问题。

技术介绍

[0002]近十年机器学习算法被广泛应用于实际问题并取得巨大成功。然而,异常检测、疾病诊断和异常行为识别等领域收集的数据通常存在不平衡的问题,这是机器学习算法在实际应用过程中必须要解决的困难之一。更重要的是,少数类样本要比多数类更为重要。例如,在癌症诊断中,健康个体的样本数可以是癌症患者样本的上千倍,但算法的目的是要正确诊断出患有癌症的个体。许多机器学习算法最初提出时并没有考虑数据偏斜的情况,所以这些算法在处理不平衡的分类问题时失效。随着机器学习的发展,解决不平衡分类的算法也陆续提出,总体上可分类两大类:数据层面和算法层面。前者的主要思想是通过不同的重采样技术重新平衡数据的分布,如随机欠采样(RUS),随机过采样(ROS)和SMOTE等。相比之下,后者则通过给不同的类或样本分配权值或代价调整原始算法,减少类别间样本量造成的偏差。
[0003]决策树不仅是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的不平衡分类决策树生成方法,其特征在于,包括以下步骤:步骤(1):数据预处理;对数据集D包含特征进行依次编号,同时把数据集归一化到[0,1]区间并且提取每个特征的p分位数;步骤(2):决策树生成过程的状态空间表示;对决策树中的决策节点以及决策树整体进行向量表示;步骤(3):决策树生成过程的动作空间表示;把决策树生成过程中节点位置选择、节点操作选择、划分特征选择以及划分阈值选择对应到马尔可夫决策过程中的动作空间;步骤(4):利用常见的不平衡分类评估指标设计奖励函数;步骤(5):把决策树生成过程建模成标准的马尔可夫决策过程,并运用已有的深度强化学习算法进行求解最优生成策略和决策树结构。2.如权利要求1所述的基于深度强化学习的不平衡分类决策树生成方法,其特征在于:步骤(1)中对于任意一个包含m个连续特征的数据集D,把特征依次编码为ID={1,2,3,...,m},在把数据集归一化到[0,1]区间后,提取每个特征的n个分位数,得到一个阈值矩阵K其中k
ij
表示第j个特征的第i个分位数,0<i<n,0<i<m,通常n=9,即k
·
j
={10%,20%,30%,40%,50%,60%,70%,80%,90%}分位数。3.如权利要求2所述的基于深度强化学习的不平衡分类决策树生成方法,其特征在于:在所述步骤(2)中,针对任意二分类决策树结构,编码时均忽略叶子节点,只对决策节点进行编码。4.如权利要求3所述的基于深度强化学习的不平衡分类决策树生成方法,其特征在于:在所述步骤(2)中,对于一个以第m个特征,阈值k作为划分的决策节点Node
km
,它的向量表示为[ID
m
,k],向量化的决策树与原始决策树保持相同的结构。5.如权利要求4所述的基于深度强化学习的不平衡分类决策树生成方法,其特征在于:在所述步骤(3)中,在定义决策树生成的动作空间时,需首先给定满二叉决策树的最大节点数N,并对节点按照层次遍历或先序遍历等方式对节点位置进行编号,节点位置选择的动作空间A
p
={1,2,...,N},决策节点操作有添加、删除、修改三种方式,得节点操作选择的动作空间A
o
={add,delete,update};再根据步骤(1)对特征的编码ID以及阈值矩阵K,划分特征选择和划分阈值选择的动作空间分别为A
f
={1,2,...,m}以及A
s
={1,2,...,n},最终,决策树生成过程的动作空间A={A
p
,A
o
,A
f
,A
s
}。6.如权利要求4所述的基于深度强化学习的不平衡分类决策树生成方法,其特征在于:在所述...

【专利技术属性】
技术研发人员:温桂铉吴开贵
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1