一种基于GBDT的学生人格倾向预测方法技术

技术编号:26765230 阅读:46 留言:0更新日期:2020-12-18 23:41
本发明专利技术公开了一种基于GBDT的学生人格倾向预测方法,涉及学生人格倾向预测技术领域,包括以下步骤:预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;将采集的心理状态信息和网络访问日志数据信息进行数据建模,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。本发明专利技术实现能对学生心理状态进行预测,不仅适应性广,而且减少了创建量表和分发量表以及收集量表的时间,预测成本低且效率高。

【技术实现步骤摘要】
一种基于GBDT的学生人格倾向预测方法
本专利技术涉及学生人格倾向预测
,具体来说,涉及一种基于GBDT的学生人格倾向预测方法。
技术介绍
现阶段国内结合数据挖掘模型的方法对学生心理状态进行研究工作主要有两个方面:一是基于社交网络数据的心理分析研究,其中比较主流的研究是通过新浪微博数据对用户的人格进行预测;另一方面是通过影响心理状态的因素入手,例如青少年感恩量表(AGS)和自评抑郁量表(SDS)等。对人格心理方面的研究集中于抑郁焦虑等心理状态与个体性格之间的关联性上。总的来说现阶段的研究主要局限于某类特定群体的行为分析以及就影响因素方面的心理学分析与阐释,而大数据时代的到来,高效信息化平台的建设越来越完善,获取学生全天24小时的在校上网行为数据更是极大量的数据,研究价值也更高,此前却很少或者几乎没有使用高校计算方法来研究这种数据。故基于这种数据,运用数据处理技术以及机器学习中的算法与模型,胃实现对学生心理状态的预测带来了可能。因此亟需一种基于GBDT的学生人格倾向预测方法,尽可能不造成学生心理负担的情况下,去分析出学生心理状态信息,从而辅助心理学工作者能够更好地开展工作。检索中国专利技术专利CN109549644A公开了基于脑电采集的人格特征匹配系统,涉及特殊岗位性格匹配
,包括:脑电采集模块、人格特征问卷模块和机器学习算法模块;所述脑电采集模块与人格特征问卷模块分别用于采集脑电信号与人格特征信号;所述机器学习算法模块用于接收脑电信号与人格特征信号并建立特定人群的人格特征与脑电生理特征模型;通过结合人格倾向测评结果、答题反应时和静息态脑电测量结果,通过人工智能机器学习算法,对于优秀的候选人和严重的人格障碍患者的主观和客观测量指标进行数学建模,从而提高优秀岗位胜任者的选拔命中率。但其不能对人格倾向进行预测,且数据信息不具备参考性。针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中的问题,本专利技术提出一种基于GBDT的学生人格倾向预测方法,以克服现有相关技术所存在的上述技术问题。本专利技术的技术方案是这样实现的:一种基于GBDT的学生人格倾向预测方法,包括以下步骤:步骤S1,预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;步骤S2,将采集的心理状态信息和网络访问日志数据信息进行数据建模,其中包括获取特征数据信息和采集的标签数据信息合并;步骤S3,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据;步骤S4,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。进一步的,步骤所述将采集的心理状态信息和网络访问日志数据信息进行数据建模,包括以下步骤:预先按照访问网址统计每个学生的访问次数,其中包括标定学生ID;将访问网址进行分类,确定不同分类标签的学生访问次数;对同分类标签的学生访问次数进行筛选,包括分别标定没有心理问题的学生IDY和有问题的学生记为IDN。进一步的,步骤所述获取的特征数据信息进行降维处理,包括对特征数据信息基于主成分分析法进行降维处理。进一步的,步骤所述分成训练数据和测试数据,包括基于十折交叉验证分成训练数据和测试数据。进一步的,步骤所述GBDT回归算法训练GBDT模型,包括以下步骤:初始学习器,包括首先构造初始学习器,取训练样本标签值的均值;训练决策树,包括先构建第1颗决策树,首先确定每个样本的残差,残差=标签值-预测值;根据二叉树的递归特性,对子节点继续添加分支条件,每个叶子节点的预测值=包含样本的标签值的均值,其训练好的决策树包含分支条件、叶子节点的预测值和关联的样本索引;更新学习器,训练好一颗决策树后,可以在上个学习器的基础上获取新学习器,得到新的学习器后,再次确定每个样本的残差,创建第2颗决策树对残差进行拟合,反复训练N颗决策树后,训练结束。进一步的,所述更新学习器,包括以下步骤:遍历当前决策树的所有叶子节点;获取每个叶子节点的预测值、关联的样本索引;对每个关联的样本更新学习器。本专利技术的有益效果:本专利技术基于GBDT的学生人格倾向预测方法,通过预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息,将采集的心理状态信息和网络访问日志数据信息进行数据建模,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测,实现能对学生心理状态进行预测,不仅适应性广,而且减少了创建量表和分发量表以及收集量表的时间,预测成本低且效率高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的一种基于GBDT的学生人格倾向预测方法的流程示意图;图2是根据本专利技术实施例的一种基于GBDT的学生人格倾向预测方法的测试示意图;图3是根据本专利技术实施例的一种基于GBDT的学生人格倾向预测方法的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。根据本专利技术的实施例,提供了一种基于GBDT的学生人格倾向预测方法。如图1-图2所示,根据本专利技术实施例的基于GBDT的学生人格倾向预测方法,包括以下步骤:步骤S1,预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;步骤S2,将采集的心理状态信息和网络访问日志数据信息进行数据建模,其中包括获取特征数据信息和采集的标签数据信息合并;步骤S3,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据;步骤S4,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。其中,步骤所述将采集的心理状态信息和网络访问日志数据信息进行数据建模,包括以下步骤:预先按照访问网址统计每个学生的访问次数,其中包括标定学生ID;将访问网址进行分类,确定不同分类标签的学生访问次数;对同分类标签的学生访问次数进行筛选,包括分别标定没有心理问题的学生IDY和有问题的学生记为ID本文档来自技高网
...

【技术保护点】
1.一种基于GBDT的学生人格倾向预测方法,其特征在于,包括以下步骤:/n预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;/n将采集的心理状态信息和网络访问日志数据信息进行数据建模,其中包括获取特征数据信息和采集的标签数据信息合并;/n将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据;/n基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。/n

【技术特征摘要】
1.一种基于GBDT的学生人格倾向预测方法,其特征在于,包括以下步骤:
预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;
将采集的心理状态信息和网络访问日志数据信息进行数据建模,其中包括获取特征数据信息和采集的标签数据信息合并;
将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据;
基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。


2.根据权利要求1所述的基于GBDT的学生人格倾向预测方法,其特征在于,步骤所述将采集的心理状态信息和网络访问日志数据信息进行数据建模,包括以下步骤:
预先按照访问网址统计每个学生的访问次数,其中包括标定学生ID;
将访问网址进行分类,确定不同分类标签的学生访问次数;
对同分类标签的学生访问次数进行筛选,包括分别标定没有心理问题的学生IDY和有问题的学生记为IDN。


3.根据权利要求1所述的基于GBDT的学生人格倾向预测方法,其特征在于,步骤所述获取的特征数据信息进行降维处理,包括对特征数据信息基于主成分分析法进行...

【专利技术属性】
技术研发人员:张晗秦勇
申请(专利权)人:东莞理工学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1