一种基于决策树的戒毒人员戒治效果评估方法技术

技术编号：30824491 阅读：16 留言：0更新日期：2021-11-18 12:17

本发明专利技术提供一种基于决策树的戒毒人员戒治效果评估方法，属于机器学习技术领域。该方法包括以下技术步骤：S1：目标函数选择；S2：特征选择；S3：训练过程：S4：评估过程。本发明专利技术方法得到的戒毒人员戒治效果评估模型可以对戒毒人员进行定期的戒治效果评估，评估只需要从信息系统数据库中提取数据，评估过程简单成本低，无需加入额外的人为主观判断，准确率高，输出指标易于理解和把握，灵活性高，可以适应各地域不同的制度、不同的技术设备带来的巨大差异，适应性强，当制度变化，技术进步导致数据发生巨大变化之后，可以通过重新训练模型的方式快速适应变化。快速适应变化。快速适应变化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于决策树的戒毒人员戒治效果评估方法

[0001]本专利技术属于机器学习
，具体涉及一种基于决策树的戒毒人员戒治效果评估方法。

技术介绍

[0002]虽然目前已经提出很多强制戒毒人员戒治效果的评估方法，但是在实际操作过程中，普遍存在操作难度较大、评估信度效度较低的问题。另外，现有的评估方法的设计均基于经验，无法快速灵活改变参数，难以适应新技术发展、信息系统和相关制度变化带来的环境变化。
[0003]现有戒毒信息系统中已经有大量的数据和戒治效果直接相关，例如计分考核数据、考试成绩、医疗检验结果和康复训练数据等；但这些数据缺乏统一标准，各地域之间差别巨大，每次制度变化和技术进步，都会导致这些数据发生巨大变化，直接从这些数据中靠人工分析方式评价戒治效果很困难，不直观，评估结果精确度严重依赖于评估人员的经验。

技术实现思路

[0004]针对以上问题，本专利技术提供一种基于决策树的戒毒人员戒治效果评估方法，通过目标函数选择、特征选择、训练过程和评估过程，得到的戒毒人员戒治效果评估模型可以对戒毒人员进行定期的戒治效果评估，评估只需要从信息系统数据库中提取数据，评估过程简单成本低，无需加入额外的人为主观判断，准确率高，输出指标易于理解和把握，灵活性高，可以适应各地域不同的制度、不同的技术设备带来的巨大差异，适应性强，当制度变化，技术进步导致数据发生巨大变化之后，可以通过重新训练模型的方式快速适应变化。
[0005]本专利技术通过以下技术方案实现：
[0006]一种基于决策树的戒毒人...

【技术保护点】

【技术特征摘要】
1.一种基于决策树的戒毒人员戒治效果评估方法，其特征在于，包括以下步骤：S1：目标函数选择：从戒毒人员多维数据中选择一个维度YD作为目标函数；S2：特征选择：从戒毒人员多维数据选择一组特征FD；S3：训练过程：根据目标函数YD和特征FD建立训练数据集TrainSet，训练决策树回归模型DTM，计算模型DTM中每个叶子节点的参数LNSTD和LNMEAN，保存决策树回归模型DTM、全体均值GMEAN、全体标准差GSTD、样本标准差LNSTD和样本均值LNMEAN，训练过程完成；S4：评估过程；加载训练过程保存的决策树回归模型DTM、全体均值GMEAN、全体标准差GSTD、样本标准差LNSTD和样本均值LNMEAN，用决策树回归算法根据模型DTM预测被评估人员的目标函数YD值，获得命中的决策树回归模型DTM叶子节点计算LSS，根据被评估人员的目标函数YD值、全体均值GMEAN、全体标准差GSTD计算GSS，作为评估结果输出LSS和GSS。2.根据权利要求1所述的基于决策树的戒毒人员戒治效果评估方法，其特征在于，步骤S3中，所述训练决策树回归模型DTM为从数据集TrainSet中，提取month等于mi的样本，放入子集ModelTrainSet用于训练决策树回归模型DTM，即提取第mi月的数据训练决策树回归模型DTM，mi取month的中间值或取mi＝12。3.根据权利要求2所述的基于决策树的戒毒人员戒治效果评估方法，其特征在于，步骤S3中，所述子集ModelTrainSet训练决策树回归模型DTM过程中，控制叶子节点的最小样本数>MNS，其中10≤MNS<子集ModelTrainSet样本总数或叶子节点总数。4.根据权利要求1所述的基于决策树的戒毒人员戒治效果评估方法，其特征在于，步骤S3中，所述计算决策树回归模型DTM中每个叶子节点的参数LNSTD和LNMEAN为将得到的决策树回归模型DTM中所有叶子节点放到统一的叶子节点数组lnodes中，叶子节点数为lnsize，lnsize等于lnodes的长度，计算命中叶子节点的所有数据集TrainSet样本的标准差LNSTD数组和均值LNMEAN数组，样本标准差LNSTD和样本均值LNMEAN均为二维数组，第一维表示月份，长度为36，第二维表示节点，长度为lnsize，LNSTD[m][i]的值为命中第i个叶子节点的第m个月样本的label的标准差，LNMEAN[m][i]的值为命中第i个叶子节点的第m个月样本的label的平均值。5.根据权利要求4所述的基于决策树的戒毒人员戒治效果评估方法，其特征在于，步骤S3中，所述样本标准差LNSTD和样本均值LNMEAN的具体计算方法为：S301：建立集合数组TSS，集合数组TSS为一个二维数组，第一维表示月份，长度为36，第二维表示节点，长度为叶子节点数lnsize，集合数组TSS的所有元素初始化为空集；S302：列举数据集TrainSet集合中每一个样本x，用决策树回归算法预测x.features的预测值py，忽略预测值py，取预测过程中命中的决策树叶子节点在叶子节点数组lnodes中的下标lni，将样本x加入子集TSS[x.month][lni]；S303：列举集合数组TSS的每个元素TSS[m][j]...

【专利技术属性】
技术研发人员：陆宇升，李家深，朱晓东，许金礼，陶炜，廖淑珍，
申请(专利权)人：广西友迪资讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人