当前位置: 首页 > 专利查询>清华大学专利>正文

神经网络到决策树的转换方法、存储介质及电子设备技术

技术编号:26260116 阅读:105 留言:0更新日期:2020-11-06 17:55
本发明专利技术公开了一种神经网络到决策树的转换方法、存储介质及电子设备,方法包括:获取局部视野网络系统的强化学习决策环境和神经网络决策策略,向强化学习决策环境中输入初始值以得到观测值和观测值对应的值函数,并将观测值输入至神经网络决策策略,以得到观测值对应的输出决策和q值向量,并将输出决策作为新的初始值,直至得到设定数量的观测值和与每个观测值对应的输出决策、值函数以及q值向量,并将每一个观测值和观测值对应的决策、值函数以及q值向量作为一组数据以得到包括多组数据的数据集,利用决策树算法对数据集进行训练以得到目标决策树,通过上述方法获得的目标决策树结构清晰且便于理解,并能够对待决策观测值进行决策得到决策结果。

【技术实现步骤摘要】
神经网络到决策树的转换方法、存储介质及电子设备
本专利技术涉及机器学习
,具体涉及一种神经网络到决策树的转换、存储介质及电子设备。
技术介绍
运用深度强化学习技术以使得计算机网络能够处理实验数据并且得出关于其的结论。例如,深度强化学习训练得到的神经网络可以用于拥塞控制、路由器数据流调度、视频流媒体传输码率调整等场景。然而,神经网络经常包含成千上万的神经元,在决策过程中通常需要经过一系列非线性的计算得出最终的结论,但由于现有的深度神经网络的结构复杂,不便于理解,因此难以获得信任和使用。
技术实现思路
本专利技术的目的在于为基于深度强化学习的局部视野网络系统提供了一种神经网络到决策树的转换方法、存储介质及电子设备,用于获得结构清晰且便于理解的决策树。第一方面,本专利技术提供一种神经网络到决策树的转换方法,所述方法包括:步骤a:获取局部视野网络系统的强化学习决策环境和神经网络决策策略;步骤b:向所述强化学习决策环境中输入初始值并进行观测以得到观测值和该观测值对应的值函数,并将该观测值输入至所述神经网络本文档来自技高网...

【技术保护点】
1.一种神经网络到决策树的转换方法,其特征在于,所述方法包括:/n步骤a:获取局部视野网络系统的强化学习决策环境和神经网络决策策略;/n步骤b:向所述强化学习决策环境中输入初始值并进行观测以得到观测值和该观测值对应的值函数,并将该观测值输入至所述神经网络决策策略,以得到该观测值对应的输出决策和q值向量;/n步骤c:将所述输出决策作为新的初始值,并返回执行步骤b,直至得到设定数量的观测值和与每个观测值对应的输出决策、值函数以及q值向量,并将每一个观测值和该观测值对应的决策、值函数以及q值向量作为一组数据以得到包括多组数据的数据集;/n步骤d:利用决策树算法对所述数据集进行训练以得到目标决策树,以...

【技术特征摘要】
1.一种神经网络到决策树的转换方法,其特征在于,所述方法包括:
步骤a:获取局部视野网络系统的强化学习决策环境和神经网络决策策略;
步骤b:向所述强化学习决策环境中输入初始值并进行观测以得到观测值和该观测值对应的值函数,并将该观测值输入至所述神经网络决策策略,以得到该观测值对应的输出决策和q值向量;
步骤c:将所述输出决策作为新的初始值,并返回执行步骤b,直至得到设定数量的观测值和与每个观测值对应的输出决策、值函数以及q值向量,并将每一个观测值和该观测值对应的决策、值函数以及q值向量作为一组数据以得到包括多组数据的数据集;
步骤d:利用决策树算法对所述数据集进行训练以得到目标决策树,以使所述目标决策树能够对待决策观测值进行决策得到决策结果。


2.根据权利要求1所述的神经网络到决策树的转换方法,其特征在于,利用决策树算法对所述数据集进行训练以得到决策树,包括:
对所述数据集进行采样,以得到采样数据集;
对所述采样数据集采用分类与回归树算法进行训练,以得到初始决策树;
对所述初始决策树进行剪枝处理以得到目标决策树。


3.根据权利要求2所述的神经网络到决策树的转换方法,其特征在于,对所述数据集进行采样,以得到采样数据集,包括:
对所述数据集利用预设采样概率计算式进行采样处理,以得到采样数据集,其中,所述预设采样概率计算式为表示只对括号中成立的情况进行计算,且D为数据集,i为观测值,o为输出决策,p(i,o)为观测值的采样概率,v(i)为值函数,mino′q(i,o′)为将观测值输入至强化学习决策环境中得到多个输出可能值中最小的输出可能值对应的q值向量。


4.根据权利要求2所述的神经网络到决策树的转换方法,其特征在于,对所述初始决策树进行剪枝处理以得到目标决策树,包括:
计算所述初始决策树中每个节点的代价复杂度,并根据每个所述节点的代价复杂度对各所述节点进行排序;
根据各所述节点的排序顺序对所述初始决策树中的节点进行修剪,以得到目标决策树。


5.根本权利要求4所述的神经网络到决策树的转换方法,其特征在于,计算所述初始决策树中每个节点的代价复杂度,包括:...

【专利技术属性】
技术研发人员:徐明伟孟子立王敏虎白家松
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1