【技术实现步骤摘要】
一种基于分类神经网络的学生画像生成方法
[0001]本专利技术涉及神经网络和机器学习
,特别是一种基于分类神经网络的学生画像生成方法。
技术介绍
[0002]随着在线学习系统中学生学习记录数据量的剧增,基于神经网络的学生画像生成技术迅速发展,该类方法基于学生的历史学习数据,跟踪学生的学习进展,进而描绘出学生的知识掌握水平等。对于在线学习系统,画像生成需要满足高准确度的同时满足高实时性,以提升用户体验。如何更快、更精准的生成学生画像仍然是一个极具挑战的问题。
[0003]目前,基于深度神经网络的知识追踪技术取得了比传统BKT方法更好的预测性能,且能够更深层次的捕捉练习文本的时序特征和语义特征。因此,基于深度神经网络的技术被广泛研究讨论。大多数工作致力于通过提升预测学生答题对错的准确度来提升学生画像的准确度,如结合教育数据特征改进模型:Cheng等人在DKT中引入失误和猜测因子以更好的模拟学生的真实做题情况。Nagatani等人引入时间间隔来模拟学生的遗忘行为,研究时间间隔对预测准确率的影响;引入注意力机制:Su等人提出在模型预测输出时使用余弦相似度计算练习题目相似性,有效捕获了练习序列中的长期依赖关系;可解释性知识追踪:EKT将每个学生的知识状态向量扩展成一个随时间更新的知识状态矩阵,其中每个向量代表学生对某个概念的掌握程度,有效解决传统DKT难以确定学生擅长或不熟悉哪些概念问题。但是,目前的工作在准确度和训练效率方面仍然存在问题。1)大多数研究忽略了训练数据分散性对预测结果的负面影响,即将所有学生对所有 ...
【技术保护点】
【技术特征摘要】
1.一种基于分类神经网络的学生画像生成方法,其特征在于,该方法具体包括以下步骤:S100:参与知识追踪训练的K个设备将设备标识号、本地数据标签以及每种标签的数量的分布信息发至中央服务器;S200:中央服务器使用数学模型生成学生、题目嵌入向量;S300:中央服务器接收设备发送的信息,并为每个代理服务器统计数据分布,使用可控的分类方法对生成的学生和题目的嵌入向量进行分类,并对不同类别学生和题目进行模型构建,对数据进行可分布式部署;S400:中央服务器把分类后的学生、题目信息进行重映射,并和初始化的神经网络模型的权重参数W0和b0一同发送给对应的代理服务器;S500:各代理服务器利用中央服务器发送的数据集并行训练模型,代理服务器会更新本组本轮训练得到权重参数W
*
和b
*
,之后所有代理服务器将使用自行更新后的权重参数W
*
和b
*
继续训练,代理服务器训练过程中将权重参数W
*
和b
*
发送给中央服务器,中央服务器根据代理服务器发送来的权重参数W
*
和b
*
还原知识追踪模型,并预测出该类学生的知识状态;S600:中央服务器通过联合平均算法更新学生的知识状态,并将更新后的知识状态进行可视化构造出学生的用户画像;S700:重复上述步骤S500~S600,直至模型收敛结束训练,得到最终的学生画像。2.根据权利要求1所述的基于分类神经网络的学生画像生成方法,其特征在于,所述步骤S100中的K=M*N,其中,M为用户画像的个数;N为题目特征的个数。3.根据上述权利要求1所述的基于分类神经网络的学生画像生成方法,其特征在于,所述步骤S200中的数学模型由下述(a)~(b)式计算:Q=DNN(L,N,
…
,Time)
ꢀꢀꢀ
(b);式中:X为输入层向量,且由文本信息T、知识点向量K和次要压缩信息的向量拼接而成;T为文本信息;K为知识点向量;Q为Q矩阵,表示题目和知识点关系;L为题目难度;N为学生答题平均提示次数;Time为学生答题平均做题时间;所述次要压缩信息由难度、提示次数和训练时间的次要信息共同训练压缩而成。4.根据权利要求1所述的基于分类神经网络的学生画像生成方法,其特征在于,所述步骤S300中可控的分类方法为下述(c)~(d)式表示的K
‑
means算法对生成的学生和题目的嵌入向量进行分类:C
(i)
:=arg min
j
||x
(i)
‑
μ
j
||2ꢀꢀꢀꢀꢀ
(c);式中:c
(i)
为学生i在k个类中距离最近的类;μ
j
为类j的质心;x
(i)
为学生i的n维向量。5.根据权利要求1所述的基于分类神经网络的学...
【专利技术属性】
技术研发人员:夏江华,诸葛晴凤,王寒,沙行勉,
申请(专利权)人:华东师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。