【技术实现步骤摘要】
一种试题难度增强的综合知识追踪方法
[0001]本专利技术属于人工智能和教育数据领域,尤其涉及一种试题难度增强的综合知识追踪方法。
技术背景
[0002]知识追踪的任务是利用学生的历史学习过程交互数据,对学生的知识状态,即知识的掌握程度随时间的变化过程进行追踪和建模,以能更为准确的预测学生在未来学习中的答题表现以及知识掌握水平。近年来,知识追踪因其在教育中的重要意义而备受关注,在智能辅导系统、在线教育平台以及个性化习题推荐系统中都得到了广泛的应用。
[0003]知识追踪有许多解决方法,例如概率图模型和贝叶斯模型,而随着深度神经网络的快速发展,基于深度知识追踪的相关模型取得了出色的效果,例如最先将深度学习引入知识追踪问题并用隐层状态代表知识状态的DKT模型,通过注意力机制捕捉学生在相似题目上的相似表现的AKT模型,通过图神经网络对知识状态进行建模的GKT模型。但目前只有少部分方法考虑了试题难度对学生知识掌握的影响,它们仅仅把答对题目的人数比例作为试题难度,这样粗糙的处理方式对一些长尾试题不合理。其次,不同的方法在建模知识追踪过程时考虑的因素都不同,目前尚没有一个统一的模型综合考虑了学习过程中的多种因素,如知识更新、遗忘、试题相关性、学生心理能力等。
技术实现思路
[0004]本专利技术的目的是提供一种试题难度增强的综合知识追踪方法,其目的通过对学生的做题能力和试题及知识点难度的充分分析作为输入的重要部分并通过注意力机制累积回答与当前试题相关的历史试题时的知识状态,在考虑学生的答题过程心理能力的场 ...
【技术保护点】
【技术特征摘要】
1.一种试题难度增强的综合知识追踪方法,其特征在于,包括:由学生的历史答题记录数据与相应的试题数据构成的数据集,初始化定义学生的答题过程心理能力数据,经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度,对数据进行嵌入处理,最后使用深度学习方法训练知识追踪模型,得到每个学生的知识状态和优化后的心理能力数据并通过学生的知识状态和心理能力数据预测学生在未来试题上的表现。2.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,由学生的历史答题记录数据与相应的试题数据构成的数据集包括:试题号、试题得分情况以及每道试题所涉及的知识点;对于一个学生历史答题记录数据集D,包含了I名学生的集合S={s1,s2,
…
,s
i
,
…
,s
I
},包含了J道试题集合E={e1,e2,
…
,e
j
,
…
,e
J
}以及知识点集合K={k1,k2,
…
,k
m
,
…
,k
M
},每一道试题都被预先标注了所涉及的知识点,试题与知识点的联系通过Q矩阵来进行表示,Q∈R
J
×
M
,矩阵由0和1组成,Q
jm
=1表示试题e
j
涉及知识点k
m
反之则不涉及,其中学生的答题交互序列定义为x={(e1,C1,r1),(e2,C2,r2),
…
,(e
t
,C
t
,r
t
)},其中一个元组(e
t
,C
t
,r
t
)代表一个学习单元,其中e
t
代表试题,C
t
代表与试题e
t
相关的知识点集合,r
t
代表回答正确与否即r
t
∈{0,1},1代表回答正确,0代表回答错误。3.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,初始化定义学生的答题过程心理能力数据包括;初始化一个矩阵的矩阵,其中每一行就代表了一个学生的答题心理能力即学生s
t
的心理能力用向量来表示。4.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度,具体包括;学生s
i
做题能力g
i
的计算公式如下:其中E
i
是学生s
i
在学习过程中的试题序列,e
j
代表E
i
中的第j题,|E
i
|代表试题序列的长度,J代表试题数量,r
ij
∈{0,1}代表学生s
i
回答试题序列中试题e
j
正确与否;试题e
j
难度ed
j
的计算公式如下:其中S
j
代表回答过试题e
j
的学生集合,g
i
代表S
j
中的学生s
i
的做题能力,其中|S
j
|代表学生集合的长度,I代表总学生数量,r
ij
∈{0,1}代表学生s
i
回答试题e
j
正确与否;知识点k
m
难度kd
m
的计算公式如下:
其中E
m
代表涉及该知识点的试题的集合,|E
m
|代表集合长度,ed
j
代表E
m
中试题e
j
的试题难度,即知识点难度通过对涉及到该知识点的所有试题的难度求平均值计算得到。5.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,对数据进行嵌入处理包括:对试题集合E进行one
‑
hot编码,随后使用嵌入矩阵对试题向量进行Embedding操作,其中J代表试题的数量,d
e
代表Embedding后的试题向量维度,随后每个学习单元的试题e
t
就用向量来表示;对知识点集合K进行one
‑
hot编码,随后使用嵌入矩阵对试题向量进行Embedding操作,其中M代表知识点的数量,d
k
代表Embedding后的知识点向量维度,随后每个知识点k
m
用向量k
m
表示,并且每个交互单元的试题e
t
所涉及的知识点集合C
t
就用集合中的知识点向量相加后表示,即知识点集合C
t
可以用向量来表示,公式如下:对试题难度按照最大最小值区间划分为n个档次,使得试题难度从标量转化为类别,对难度类别进行one
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。