一种基于决策树的戒毒人员戒治效果评估方法技术

技术编号:30824491 阅读:16 留言:0更新日期:2021-11-18 12:17
本发明专利技术提供一种基于决策树的戒毒人员戒治效果评估方法,属于机器学习技术领域。该方法包括以下技术步骤:S1:目标函数选择;S2:特征选择;S3:训练过程:S4:评估过程。本发明专利技术方法得到的戒毒人员戒治效果评估模型可以对戒毒人员进行定期的戒治效果评估,评估只需要从信息系统数据库中提取数据,评估过程简单成本低,无需加入额外的人为主观判断,准确率高,输出指标易于理解和把握,灵活性高,可以适应各地域不同的制度、不同的技术设备带来的巨大差异,适应性强,当制度变化,技术进步导致数据发生巨大变化之后,可以通过重新训练模型的方式快速适应变化。快速适应变化。快速适应变化。

【技术实现步骤摘要】
一种基于决策树的戒毒人员戒治效果评估方法


[0001]本专利技术属于机器学习
,具体涉及一种基于决策树的戒毒人员戒治效果评估方法。

技术介绍

[0002]虽然目前已经提出很多强制戒毒人员戒治效果的评估方法,但是在实际操作过程中,普遍存在操作难度较大、评估信度效度较低的问题。另外,现有的评估方法的设计均基于经验,无法快速灵活改变参数,难以适应新技术发展、信息系统和相关制度变化带来的环境变化。
[0003]现有戒毒信息系统中已经有大量的数据和戒治效果直接相关,例如计分考核数据、考试成绩、医疗检验结果和康复训练数据等;但这些数据缺乏统一标准,各地域之间差别巨大,每次制度变化和技术进步,都会导致这些数据发生巨大变化,直接从这些数据中靠人工分析方式评价戒治效果很困难,不直观,评估结果精确度严重依赖于评估人员的经验。

技术实现思路

[0004]针对以上问题,本专利技术提供一种基于决策树的戒毒人员戒治效果评估方法,通过目标函数选择、特征选择、训练过程和评估过程,得到的戒毒人员戒治效果评估模型可以对戒毒人员进行定期的戒治效果评估,评估只需要从信息系统数据库中提取数据,评估过程简单成本低,无需加入额外的人为主观判断,准确率高,输出指标易于理解和把握,灵活性高,可以适应各地域不同的制度、不同的技术设备带来的巨大差异,适应性强,当制度变化,技术进步导致数据发生巨大变化之后,可以通过重新训练模型的方式快速适应变化。
[0005]本专利技术通过以下技术方案实现:
[0006]一种基于决策树的戒毒人员戒治效果评估方法,包括以下步骤:
[0007]S1:目标函数选择:从戒毒人员多维数据中选择一个维度YD作为目标函数;
[0008]S2:特征选择:从戒毒人员多维数据选择一组特征FD;
[0009]S3:训练过程:根据目标函数YD和特征FD建立训练数据集TrainSet,训练决策树回归模型DTM,计算模型DTM中每个叶子节点的参数LNSTD和LNMEAN,保存决策树回归模型DTM、全体均值GMEAN、全体标准差GSTD、样本标准差LNSTD和样本均值LNMEAN,训练过程完成;
[0010]S4:评估过程;加载训练过程保存的决策树回归模型DTM、全体均值GMEAN、全体标准差GSTD、样本标准差LNSTD和样本均值LNMEAN,用决策树回归算法根据模型DTM预测被评估人员的目标函数YD值,获得命中的决策树回归模型DTM叶子节点计算LSS,根据被评估人员的目标函数YD值、全体均值GMEAN、全体标准差GSTD计算GSS,作为评估结果输出LSS和GSS。
[0011]进一步地,步骤S3中,所述训练决策树回归模型DTM为从数据集TrainSet中,提取month等于mi的样本,放入子集ModelTrainSet用于训练决策树回归模型DTM,即提取第mi月的数据训练决策树回归模型DTM,mi取month的中间值或取mi=12。
[0012]进一步地,步骤S3中,所述子集ModelTrainSet训练决策树回归模型DTM过程中,控制叶子节点的最小样本数>MNS,其中10≤MNS<子集ModelTrainSet样本总数或叶子节点总数。
[0013]进一步地,步骤S3中,所述计算决策树回归模型DTM中每个叶子节点的参数LNSTD和LNMEAN为将得到的决策树回归模型DTM中所有叶子节点放到统一的叶子节点数组lnodes中,叶子节点数为lnsize,lnsize等于lnodes的长度,计算命中叶子节点的所有数据集TrainSet样本的标准差LNSTD数组和均值LNMEAN数组,样本标准差LNSTD和样本均值LNMEAN均为二维数组,第一维表示月份,长度为36,第二维表示节点,长度为lnsize,LNSTD[m][i]的值为命中第i个叶子节点的第m个月样本的label的标准差,LNMEAN[m][i]的值为命中第i个叶子节点的第m个月样本的label的平均值。
[0014]进一步地,步骤S3中,所述样本标准差LNSTD和样本均值LNMEAN的具体计算方法为:
[0015]S301:建立集合数组TSS,集合数组TSS为一个二维数组,第一维表示月份,长度为36,第二维表示节点,长度为叶子节点数lnsize,集合数组TSS的所有元素初始化为空集;
[0016]S302:列举数据集TrainSet集合中每一个样本x,用决策树回归算法预测x.features的预测值py,忽略预测值py,取预测过程中命中的决策树叶子节点在叶子节点数组lnodes中的下标lni,将样本x加入子集TSS[x.month][lni];
[0017]S303:列举集合数组TSS的每个元素TSS[m][j],TSS[m][j]为一个样本的子集,计算这个子集的元素label的均值和标准差,保存到LNSTD[m][i]和LNMEAN[m][i]中;
[0018]S304:建立一维集合数组GTSS,长度为36,所有元素初始化为空集,列举数据集TrainSet集合中每一个样本x,将x加入子集GTSS[x.month];
[0019]S305:列举一维集合数组GTSS的每个元素GTSS[m],GTSS[m]为一个样本的子集,计算这个子集所有样本的label的均值和标准差,保存到数组GMEAN[m]和GSTD[m],GMEAN和GSTD为一维数组,表示全体的均值和标准差,下标m表示月份。
[0020]进一步地,步骤S3中,所述数据集TrainSet为样本集合,每个样本对应多维度戒毒数据中一个人员的数据,每个样本有三个列:month、label和features,使用目标函数YD的值作为label,从多维度戒毒数据中提取选中特征FD的数据构造特征向量features,从多维度戒毒数据中提取戒毒时间作为mouth,以月为单位。
[0021]进一步地,步骤S4中,所述具体评估过程为:
[0022]S401:从存储介质加载训练过程得到的决策树回归模型DTM、全体均值GMEAN、全体标准差GSTD、样本标准差LNSTD和样本均值LNMEAN;
[0023]S402:使用与数据集TrainSet样本features列相同的方法,提取被评估人员的特征向量features,用决策树回归算法根据决策树回归模型DTM预测features的目标函数YD属性值,忽略预测值,取得features命中决策树回归模型DTM中的叶子节点的下标lni,计算被评估人员的戒毒时间month,计算参数LSS=(YD

LNMEAN[m][lni])/LNSTD[m][lni];
[0024]S403:计算GSS=(YD

GMEAN[m])/GSTD[m];
[0025]S404:输出评估结果LSS和GSS,以及LSS和GSS指标随时间变化的趋势,作为被评估人员戒治效果指标YD的直观说明;
[0026]GSS>0表示被评价人员的戒治效本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于决策树的戒毒人员戒治效果评估方法,其特征在于,包括以下步骤:S1:目标函数选择:从戒毒人员多维数据中选择一个维度YD作为目标函数;S2:特征选择:从戒毒人员多维数据选择一组特征FD;S3:训练过程:根据目标函数YD和特征FD建立训练数据集TrainSet,训练决策树回归模型DTM,计算模型DTM中每个叶子节点的参数LNSTD和LNMEAN,保存决策树回归模型DTM、全体均值GMEAN、全体标准差GSTD、样本标准差LNSTD和样本均值LNMEAN,训练过程完成;S4:评估过程;加载训练过程保存的决策树回归模型DTM、全体均值GMEAN、全体标准差GSTD、样本标准差LNSTD和样本均值LNMEAN,用决策树回归算法根据模型DTM预测被评估人员的目标函数YD值,获得命中的决策树回归模型DTM叶子节点计算LSS,根据被评估人员的目标函数YD值、全体均值GMEAN、全体标准差GSTD计算GSS,作为评估结果输出LSS和GSS。2.根据权利要求1所述的基于决策树的戒毒人员戒治效果评估方法,其特征在于,步骤S3中,所述训练决策树回归模型DTM为从数据集TrainSet中,提取month等于mi的样本,放入子集ModelTrainSet用于训练决策树回归模型DTM,即提取第mi月的数据训练决策树回归模型DTM,mi取month的中间值或取mi=12。3.根据权利要求2所述的基于决策树的戒毒人员戒治效果评估方法,其特征在于,步骤S3中,所述子集ModelTrainSet训练决策树回归模型DTM过程中,控制叶子节点的最小样本数>MNS,其中10≤MNS<子集ModelTrainSet样本总数或叶子节点总数。4.根据权利要求1所述的基于决策树的戒毒人员戒治效果评估方法,其特征在于,步骤S3中,所述计算决策树回归模型DTM中每个叶子节点的参数LNSTD和LNMEAN为将得到的决策树回归模型DTM中所有叶子节点放到统一的叶子节点数组lnodes中,叶子节点数为lnsize,lnsize等于lnodes的长度,计算命中叶子节点的所有数据集TrainSet样本的标准差LNSTD数组和均值LNMEAN数组,样本标准差LNSTD和样本均值LNMEAN均为二维数组,第一维表示月份,长度为36,第二维表示节点,长度为lnsize,LNSTD[m][i]的值为命中第i个叶子节点的第m个月样本的label的标准差,LNMEAN[m][i]的值为命中第i个叶子节点的第m个月样本的label的平均值。5.根据权利要求4所述的基于决策树的戒毒人员戒治效果评估方法,其特征在于,步骤S3中,所述样本标准差LNSTD和样本均值LNMEAN的具体计算方法为:S301:建立集合数组TSS,集合数组TSS为一个二维数组,第一维表示月份,长度为36,第二维表示节点,长度为叶子节点数lnsize,集合数组TSS的所有元素初始化为空集;S302:列举数据集TrainSet集合中每一个样本x,用决策树回归算法预测x.features的预测值py,忽略预测值py,取预测过程中命中的决策树叶子节点在叶子节点数组lnodes中的下标lni,将样本x加入子集TSS[x.month][lni];S303:列举集合数组TSS的每个元素TSS[m][j]...

【专利技术属性】
技术研发人员:陆宇升李家深朱晓东许金礼陶炜廖淑珍
申请(专利权)人:广西友迪资讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1