一种决策树模型的建模方法和装置制造方法及图纸

技术编号:33717056 阅读:21 留言:0更新日期:2022-06-08 21:07
本申请公开了一种决策树模型的建模方法,决策树模型包括决策节点和目标节点,该方法包括:获取原始数据的特征值和目标值,提取特征值的周期特征,根据周期特征,处理决策节点的决策条件,获得决策节点和目标节点的连接关系,其中,所述目标节点关联所述目标值,输出所述决策树模型。通过该技术方案,可以减少决策层级,简化决策树模型的结构,提高决策效率。提高决策效率。提高决策效率。

【技术实现步骤摘要】
一种决策树模型的建模方法和装置


[0001]本专利技术涉及计算机领域,尤其涉及一种决策树模型的建模方法、装置、存储介质和计算机程序产品。

技术介绍

[0002]决策树模型是机器学习领域的常用模型,它易于实现,被广泛应用于搜索排序,广告推荐预测、天气预测等等场景,能带来巨大的收益。
[0003]比如以预测某地的二氧化碳浓度为例,二氧化碳浓度会受到多种因素的影响,如纬度、海拔、气候类型、时间等因素。
[0004]以时间因数为例,首先将所有样本放在决策树的根节点,然后通过时间条件将样本分到决策树的两个叶子节点上,例如选取样本的时间因数是上半年还是下半年作为时间条件,将样本分到决策树的两个叶子节点上,如果还可以继续分裂,则每个叶子节点可以作为决策树的内部节点,以时间为条件,继续分裂并且产生两个新的叶子节点,依次类推,不断迭代分裂,得到最后的决策树模型。
[0005]但是,当样本具有周期特征的情况下,通过这个方法得到的最后的决策树模型结构复杂,决策层级多,决策速度慢,决策效率低。

技术实现思路

[0006]本申请提供了一种决策树模型建模的方法。随着现代信息技术的发展,数据量越来越多,而有一些数据往往呈现周期性的特征,提取这些数据的周期特征,根据周期特征处理决策树的内部节点的决策条件,可以大大简化决策树模型的结构,减少决策层级,从而提高决策效率,加快决策速度。
[0007]第一方面,提供了一种决策树模型的建模方法,决策树模型包括决策节点和目标节点,方法包括:获取原始数据的特征值和目标值,提取特征值的周期特征,根据周期特征,处理决策节点的决策条件,获得决策节点和目标节点的连接关系,其中,目标节点关联目标值,输出决策树模型。通过该技术方案,可以减少决策层级,简化决策树模型的结构,提高决策效率。
[0008]一种可行的实现方式,提取特征值的周期特征包括:将特征值按顺序划分到多个子区间,每个子区间内包含多个特征值,取多个特征值的均值作为对应子区间的特征值。获取第一序列子区间的特征值与第二序列子区间的特征值的相关系数,当相关系数大于等于阈值的时候,则子区间的特征值具有周期特征。通过相关系数大于等于阈值的方式,保证准确判断特征值是否具有周期特征。
[0009]一种可行的实现方式,第一序列包括n个连续子区间的序列,第二序列包括与第一序列间隔k个区间的n个连续子区间的序列。
[0010]一种可行的实现方式,特征值的类型包括离散类型和连续类型,
[0011]当特征值是离散类型的时候,取每个子区间内的特征值的离散值的均值作为对应
子区间的特征值;或,
[0012]当特征值是连续类型的时候,取每个子区间内的特征值的连续值的均值作为对应子区间的特征值。
[0013]一种可行的实现方式,将特征值按顺序划分到多个子区间还包括:根据多个子区间的数量或大小来将特征值划分到多个子区间。
[0014]一种可行的实现方式,方法还包括:将任意一个子区间与间隔k个区间的子区间进行合并,将合并前的特征值进行统计分析,得到合并后的特征值。
[0015]一种可行的实现方式,方法还包括:遍历合并后的子区间的分裂组合,根据合并后的特征值的收益函数选取分裂组合中最优的分裂组合作为决策节点的决策条件。
[0016]第二方面,提供了一种决策树模型的建模装置,决策树模型包括决策节点和目标节点,装置包括获取模块、提取模块、处理模块,输出模块;
[0017]获取模块用于获取原始数据的特征值和目标值;
[0018]提取模块用于提取特征值的周期特征;
[0019]处理模块用于处理决策节点的决策条件,获得决策节点和目标节点的连接关系,其中,目标节点关联目标值;
[0020]输出模块用于输出决策树模型。
[0021]通过该技术方案,可以减少决策层级,简化决策树模型的结构,提高决策效率。
[0022]一种可行的实现方式,提取模块还用于将特征值按顺序划分到多个子区间,每个子区间内包含多个特征值,取多个特征值的均值作为对应子区间的特征值。获取第一序列子区间的特征值与第二序列子区间的特征值的相关系数,当相关系数大于等于阈值的时候,则子区间的特征值具有周期特征。通过相关系数大于等于阈值的方式,保证准确判断特征值是否具有周期特征。
[0023]一种可行的实现方式,第一序列包括n个连续子区间的序列,第二序列包括与第一序列间隔k个区间的n个连续子区间的序列。
[0024]一种可行的实现方式,特征值的类型包括离散类型和连续类型,
[0025]当特征值是离散类型的时候,取每个子区间内的特征值的离散值的均值作为对应子区间的特征值;或,
[0026]当特征值是连续类型的时候,取每个子区间内的特征值的连续值的均值作为对应子区间的特征值。
[0027]一种可行的实现方式,提取模块还用于根据多个子区间的数量或大小来将特征值划分到多个子区间。
[0028]一种可行的实现方式,提取模块还用于将任意一个子区间与间隔k个区间的子区间进行合并,将合并前的特征值进行统计分析,得到合并后的特征值。
[0029]一种可行的实现方式,处理模块还用于遍历合并后的子区间的分裂组合,根据合并后的特征值的收益函数选取分裂组合中最优的分裂组合作为决策节点的决策条件。
[0030]第三方面,提供了一种非瞬态的可读存储介质,非瞬态的可读存储介质存储有计算机程序代码,当计算机程序代码被计算设备执行时,计算设备执行上述第一方面中任一项可行的实现方式。
[0031]第四方面,提供了一种计算机程序产品,计算机程序产品中包括计算机指令,当计
算机指令被计算设备执行时,计算设备执行上述第一方面中任一项可行的实现方式。
附图说明
[0032]图1A为一组空气中二氧化碳浓度随时间变化的数据示意图;
[0033]图1B为空气中二氧化碳浓度随时间的决策树模型示意图;
[0034]图1C为另一种空气中二氧化碳浓度随时间的决策树模型示意图;
[0035]图1D为机房中机柜的功率的决策树模型示意图;
[0036]图2为本申请实施例提供的一种决策树模型建模的方法流程示意图;
[0037]图3为本申请实施例提供的一种数据特征值划分bins的示意图;
[0038]图4为本申请实施例提供的一种预处理bins的方法流程示意图;
[0039]图5为本申请实施例提供的一种获取周期特征和计算最优分裂点的方法流程示意图;
[0040]图6A为本申请实施例提供的一种binSize情况下的周期特征获取示意图;
[0041]图6B为本申请实施例提供的另一种binSize情况下的周期特征获取示意图;
[0042]图6C为本申请实施例提供的另一种binSize情况下的周期特征获取示意图;
[0043]图6D为本申请实施例提供的另一种binSize情况下的周期特征获取示意图;
[0044]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种决策树模型的建模方法,其特征在于,所述决策树模型包括决策节点和目标节点,所述方法包括:获取原始数据的特征值和目标值,提取所述特征值的周期特征,根据所述周期特征,处理所述决策节点的决策条件,获得所述决策节点和所述目标节点的连接关系,其中,所述目标节点关联所述目标值,输出所述决策树模型。2.根据权利要求1所述方法,其特征在于,所述提取所述特征值的周期特征包括:将所述特征值按顺序划分到多个子区间,每个子区间内包含多个特征值,取所述多个特征值的均值作为对应子区间的特征值。获取第一序列所述子区间的特征值与第二序列所述子区间的特征值的相关系数,当所述相关系数大于等于阈值的时候,则所述子区间的特征值具有所述周期特征。3.根据权利要求2所述方法,其特征在于,所述第一序列包括n个连续子区间的序列,所述第二序列包括与所述第一序列间隔k个区间的n个连续子区间的序列。4.根据权利要求2-3任一所述方法,其特征在于,所述特征值的类型包括离散类型和连续类型,当所述特征值是所述离散类型的时候,取每个子区间内的所述特征值的离散值的均值作为所述对应子区间的特征值;或,当所述特征值是所述连续类型的时候,取每个子区间内的所述特征值的连续值的均值作为所述对应子区间的特征值。5.根据权利要求2-4任一所述方法,其特征在于,所述将所述特征值按顺序划分到多个子区间还包括:根据所述多个子区间的数量或大小来将所述特征值划分到所述多个子区间。6.根据权利要求3-5任一所述方法,其特征在于,所述方法还包括:将所述任意一个子区间与间隔所述k个区间的子区间进行合并,将合并前的特征值进行统计分析,得到所述合并后的特征值。7.根据权利要求6所述方法,其特征在于,所述方法还包括:遍历合并后的子区间的分裂组合,根据所述合并后的特征值的收益函数选取所述分裂组合中最优的分裂组合作为所述决策节点的决策条件。8.一种决策树模型的建模装置,其特征在于,所述决策树模型包括决策节点和目标节点,所述装置包括获取模块、提取模块、处理模块,输出模块;所述获取模块用于获取原始数据的特征值和目标值;所述提取模块用于提取所述特...

【专利技术属性】
技术研发人员:杨仲凯龚陈继朱明明郑卫炎
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1