一种基于时变加权的能力水平评估方法及装置制造方法及图纸

技术编号:19692592 阅读:24 留言:0更新日期:2018-12-08 11:22
本发明专利技术公开了一种基于时变加权的能力水平评估方法及装置,包括:获取训练数据;依据重要点检测方法对所述训练数据进行分段处理;为分段后的所述训练数据分配权重;依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估。由此可知,通过对训练数据进行分段加权,对越接近的时间观测点分配越高的权重,对时间越远的时间观测点分配越小的权重,考虑了训练准确率随着时间的变化情况,能够得到更加准确的能力水平评估结果。

【技术实现步骤摘要】
一种基于时变加权的能力水平评估方法及装置
本专利技术涉及数据挖掘领域,尤其涉及一种基于时变加权的能力水平评估方法及装置。
技术介绍
随着计算机技术在教育教育领域当中的广泛应用,尤其是随着近几年来在线教育学习平台的迅猛发展,教育数据挖掘成为数据挖掘领域中的研究热点。知识水平评估模型及其对应的知识水平评估算法在教育数据挖掘领域中尝尝被用于表示和评估在线学习人员的知识水平状态,并且被广泛的应用到现代智能导学系统中。但是,现有技术中,通过知识水平评估模型对能力水平的评估方法,都是对训练数据的整体准确率进行评估预测,没有考虑训练准确率随着时间的变化情况,因此,通过现有技术的评估方法得到的知识水平评估结果,并不能体现随着时间变化而使得能力水平的变化情况,这样就导致得到的评估结果误差较大,不能体现出当前的能力水平的问题。
技术实现思路
有鉴于此,本专利技术实施例公开了一种基于时变加权的能力水平评估方法及装置,解决了现有技术中得到的评估结果误差较大,不能体现出当前的能力水平的问题一种基于时变加权的能力水平评估方法,其特征在于,包括:获取训练数据;依据重要点检测方法对所述训练数据进行分段处理;为分段后的每段训练数据分配权重;依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估。可选的,所述获取训练数据包括:从预设的数据源中采集训练数据;对采集到的所述训练数据进行预处理,得到有效的训练数据。可选的,所述依据重要点检测方法对所述训练数据进行分段处理,包括:按照预设的时间窗,将所述训练数据转换为准确率序列;对所述准确率序列进行重要点检测,从准确率序列中确定重要节点;依据所述重要节点将所述训练数据分成多段。可选的,所述对所述准确率进行重要点检测,从所述时间序列中确定重要节点,包括:计算准确率序列目标段的每个准确率序列距离首尾连线的垂直距离;将距离首尾连线最大的垂直距离的准确率序列作为重要节点;依据所述重要节点,将所述准确率序列首尾之间的准确率序列进行分段;判断分段后的每段准确率序列的拟合误差是否小于预设的误差阈值;若每段都不小于预设的误差阈值,将分段后的每段准确率序列作为准确率序列目标段,并返回执行计算准确率序列目标段的每个准确率序列距离首尾连线的垂直距离;若分段后的每段都小于预设的误差阈值,结束并输出所有的重要节点。可选的,所述为分段后的所述训练数据分配权重,包括:确定分段后每段训练数据的时序;基于每段数据的时序,为每段训练数据分配权重;其中,时序靠后训练数据的权重大于时序靠前训练数据的权重。可选的,所述依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估,包括:依据分配了权重的每段训练数据,计算最大似然函数,并将所述最大似然函数作为目标函数;将所述目标函数分解为初始概率目标函数、转移概率目标函数和发射概率目标函数;分别对所述初始概率目标函数、转移概率目标函数和发射概率目标函数进行求解,获取每个目标函数的参数模型;基于所述参数模型对能力水平进行量化评估。一种基于时变加权的能力水平评估装置,包括:获取单元,用于获取训练数据;分段单元,用于依据重要点检测方法对每段训练数据进行分段处理;权重分配单元,用于为分段后的所述训练数据分配权重;量化评估单元,用于依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估。可选的,所述分段单元包括:转换子单元,用于按照预设的时间窗,将所述训练数据转换为准确率序列;重要点检测子单元,用于对所述准确率序列进行重要点检测,从准确率序列中确定重要节点;分段子单元,用于依据所述重要节点将所述训练数据分成多段。可选的,所述权重分配单元包括:时序确定子单元,用于确定分段后每段训练数据的时序;权重分配子单元,用于基于每段数据的时序,为每段训练数据分配权重;其中,时序靠后训练数据的权重大于时序靠前训练数据的权重。可选的,所述量化评估单元包括:目标函数确定子单元,用于依据分配了权重的每段训练数据,计算最大似然函数,并将所述最大似然函数作为目标函数;分解子单元,用于将所述目标函数分解为初始概率目标函数、转移概率目标函数和发射概率目标函数;获取子单元,用于分别对所述初始概率目标函数、转移概率目标函数和发射概率目标函数进行求解,获取每个目标函数的参数模型;量化评估子单元,用于基于所述参数模型对能力水平进行量化评估。本专利技术实施例公开了一种基于时变加权的能力水平评估方法及装置,包括:获取训练数据;依据重要点检测方法对所述训练数据进行分段处理;为分段后的所述训练数据分配权重;依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估。由此可知,通过对训练数据进行分段加权,对越接近的时间观测点分配越高的权重,对时间越远的时间观测点分配越小的权重,考虑了训练准确率随着时间的变化情况,能够得到更加准确的能力水平评估结果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1示出了一种基于时变加权的能力水平该评估方法的流程示意图;图2示出了一种重要点检测的示意图的流程示意图;图3示出了能力水平评估模型的示意图;图4示出了能力水平评估模型的状态转移图;图5示出了一种基于时变加权的能力水平该评估装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例示出了一种基于时变加权的能力水平该评估方法的流程示意图,在本实施例中,该方法包括:S101:获取训练数据;本实施例中,训练数据的获取可以从特定的数据源中采集,例如从相关的网站中爬取等。为了保证后续数据处理的效率,避免无效数据对数据处理的干扰,对于采集到的数据还需要进行预处理,具体的,S101包括:从预设的数据源中采集训练数据;对采集到的所述训练数据进行预处理,得到有效的训练数据。本实施例中,对训练数据预处理可以包括数据清洗、数据补全、归一化等,其中,数据清洗可以丢弃无效的训练数据,数据补全可以对残缺的数据进行补全处理,以使残缺的数据转换为有效的训练数据。S102:依据重要点检测方法对所述训练数据进行分段处理;本实施例中,训练数据包含了学生不同阶段的能力水平,不同阶段的能力水平会导致学生训练过程中不同训练准确率。现有技术中是根据训练数据的整体准确率进行评估的,这样的评估结果并不能反映学生当前的能力水平。因此,在本实施例中,将训练数据进行分段加权后再训练,其中,S102具体包括S201-S203的步骤:S201、按照预设的时间窗,将所述训练数据转换为准确率序列;S202、对所述准确率序列进行重要点检测,从准确率序列中确定重要节点;S203、依据所述重要节点将所述训练数据分为多段。本实施例中,训练数据可以为训练应答序列,表示学生练习不同阶段的准确率,是一个连续的本文档来自技高网...

【技术保护点】
1.一种基于时变加权的能力水平评估方法,其特征在于,包括:获取训练数据;依据重要点检测方法对所述训练数据进行分段处理;为分段后的每段训练数据分配权重;依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估。

【技术特征摘要】
1.一种基于时变加权的能力水平评估方法,其特征在于,包括:获取训练数据;依据重要点检测方法对所述训练数据进行分段处理;为分段后的每段训练数据分配权重;依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估。2.根据权利要求1所述的方法,其特征在于,所述获取训练数据包括:从预设的数据源中采集训练数据;对采集到的所述训练数据进行预处理,得到有效的训练数据。3.根据权利要求1和2所述的方法,其特征在于,所述依据重要点检测方法对所述训练数据进行分段处理,包括:按照预设的时间窗,将所述训练数据转换为准确率序列;对所述准确率序列进行重要点检测,从准确率序列中确定重要节点;依据所述重要节点将所述训练数据分成多段。4.根据权利要求3所述的方法,其特征在于,所述对所述准确率进行重要点检测,从所述时间序列中确定重要节点,包括:计算准确率序列目标段的每个准确率序列距离首尾连线的垂直距离;将距离首尾连线最大的垂直距离的准确率序列作为重要节点;依据所述重要节点,将所述准确率序列首尾之间的准确率序列进行分段;判断分段后的每段准确率序列的拟合误差是否小于预设的误差阈值;若每段都不小于预设的误差阈值,将分段后的每段准确率序列作为准确率序列目标段,并返回执行计算准确率序列目标段的每个准确率序列距离首尾连线的垂直距离;若分段后的每段都小于预设的误差阈值,结束并输出所有的重要节点。5.根据权利要求1所述的方法,其特征在于,所述为分段后的所述训练数据分配权重,包括:确定分段后每段训练数据的时序;基于每段数据的时序,为每段训练数据分配权重;其中,时序靠后训练数据的权重大于时序靠前训练数据的权重。6.根据权利要求1所述的方法,其特征在于,所述依据分配了权重的每段训练数据和预设的能力水平评估模型,对能力水平进行量化评估,包括...

【专利技术属性】
技术研发人员:邱菡臧艺超周天阳朱俊虎李睿曾子懿赵世斌
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1