一种试题难度增强的综合知识追踪方法技术

技术编号:36857850 阅读:11 留言:0更新日期:2023-03-15 18:03
本发明专利技术公开了一种试题难度增强的综合知识追踪方法,包括:由学生的历史答题记录数据与相应的试题数据构成的数据集,初始化定义学生的答题过程心理能力,经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度,对数据进行嵌入处理,最后使用深度学习方法训练知识追踪模型,得到每个学生的知识状态和优化后的心理能力数据并通过学生的知识状态预测和心理能力数据学生在未来试题上的表现。本发明专利技术综合考虑试题的难易情况、学生的做题能力和心理能力等因素贴近真实教育背景下的学习过程以获得合理的知识状态,最终根据学生的知识状态对学生的答题表现进行精准的预测。识状态对学生的答题表现进行精准的预测。识状态对学生的答题表现进行精准的预测。

【技术实现步骤摘要】
一种试题难度增强的综合知识追踪方法


[0001]本专利技术属于人工智能和教育数据领域,尤其涉及一种试题难度增强的综合知识追踪方法。
技术背景
[0002]知识追踪的任务是利用学生的历史学习过程交互数据,对学生的知识状态,即知识的掌握程度随时间的变化过程进行追踪和建模,以能更为准确的预测学生在未来学习中的答题表现以及知识掌握水平。近年来,知识追踪因其在教育中的重要意义而备受关注,在智能辅导系统、在线教育平台以及个性化习题推荐系统中都得到了广泛的应用。
[0003]知识追踪有许多解决方法,例如概率图模型和贝叶斯模型,而随着深度神经网络的快速发展,基于深度知识追踪的相关模型取得了出色的效果,例如最先将深度学习引入知识追踪问题并用隐层状态代表知识状态的DKT模型,通过注意力机制捕捉学生在相似题目上的相似表现的AKT模型,通过图神经网络对知识状态进行建模的GKT模型。但目前只有少部分方法考虑了试题难度对学生知识掌握的影响,它们仅仅把答对题目的人数比例作为试题难度,这样粗糙的处理方式对一些长尾试题不合理。其次,不同的方法在建模知识追踪过程时考虑的因素都不同,目前尚没有一个统一的模型综合考虑了学习过程中的多种因素,如知识更新、遗忘、试题相关性、学生心理能力等。

技术实现思路

[0004]本专利技术的目的是提供一种试题难度增强的综合知识追踪方法,其目的通过对学生的做题能力和试题及知识点难度的充分分析作为输入的重要部分并通过注意力机制累积回答与当前试题相关的历史试题时的知识状态,在考虑学生的答题过程心理能力的场景下通过对学生学习过程的学习收获和遗忘机制进行建模,较为准确的预测学生表现,追踪学生知识掌握水平的变化。
[0005]一种试题难度增强的综合知识追踪方法,其特征在于,包括:
[0006]由学生的历史答题记录数据与相应的试题数据构成的数据集,初始化定义学生的答题过程心理能力数据,经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度,对数据进行嵌入处理,最后使用深度学习方法训练知识追踪模型,得到每个学生的知识状态和优化后的心理能力数据并通过学生的知识状态和心理能力数据预测学生在未来试题上的表现。
[0007]历史答题记录信息包括:试题号、试题得分情况以及每道试题所涉及的知识点;
[0008]对于一个学生历史答题记录数据集D,包含了I名学生的集合S={s1,s2,

,s
i


,s
I
},包含了J道试题集合E={e1,e2,

,e
j


,e
J
}以及知识点集合K={k1,k2,

,k
m


,k
M
},每一道试题都被预先标注了所涉及的知识点,试题与知识点的联系通过Q矩阵来进行表示,Q∈R
J
×
M
,矩阵由0和1组成,Q
jm
=1表示试题e
j
涉及知识点k
m
反之则不涉及。其中学生的答题交互序列定义为x={(e1,C1,r1),(e2,C2,r2),

,(e
t
,C
t
,r
t
)}。其中一个元组(e
t
,C
t
,r
t
)代表
一个学习单元,其中e
t
代表试题,C
t
代表与试题e
t
相关的知识点集合,r
t
代表回答正确与否即r
t
∈{0,1},l代表回答正确,0代表回答错误。
[0009]学生的答题过程心理能力数据包括;
[0010]初始化一个矩阵的矩阵,其中每一行就代表了一个学生的答题心理能力即学生s
t
的心理能力可以用向量来表示。
[0011]学生做题能力以及试题和知识点难度计算包括;
[0012]学生s
i
做题能力g
i
的计算公式如下:
[0013][0014]其中E
i
是学生s
i
在学习过程中的试题序列,e
j
代表E
i
中的第j题,|E
i
|代表试题序列的长度,J代表试题数量,r
ij
∈{0,1}代表学生s
i
回答试题序列中试题e
j
正确与否。公式背后的直觉是答题数量越多并且正确率越高的学生的做题能力高。
[0015]试题e
j
难度ed
j
的计算公式如下:
[0016][0017]其中S
j
代表回答过试题e
j
的学生集合,g
i
代表S
j
中的学生s
i
的做题能力其中|S
j
|代表学生集合的长度,I代表总学生数量,r
ij
∈{0,1}代表学生s
i
回答试题e
j
正确与否。公式背后的直觉是对于试题e
j
,回答错误的学生的做题能力越高,回答试题的人数越少,则试题的难度越大。
[0018]知识点k
m
难度kd
m
的计算公式如下:
[0019][0020]其中E
m
代表涉及该知识点的试题的集合,|E
m
|代表集合长度,ed
j
代表E
m
中第j题的试题难度,即知识点难度通过对涉及到该知识点的所有试题的难度求平均值计算得到。
[0021]对数据进行嵌入处理包括:
[0022]对试题集合E进行one

hot编码,随后使用嵌入矩阵对试题向量进行Embedding操作,其中J代表试题的数量,d
e
代表Embedding后的试题向量维度,随后每个学习单元的试题e
t
就可以用向量来表示。
[0023]对知识点集合K进行one

hot编码,随后使用嵌入矩阵对试题向量进行Embedding操作,其中M代表知识点的数量,d
k
代表Embedding后的知识点向量维度。随后每个知识点k
m
可以用向量k
m
表示,并且每个交互单元的试题e
t
所涉及的知识点集合C
t
就可以用集合中的知识点向量相加后表示,即知识点集合C
t
可以用向量来表示,公式如下:
[0024][0025]对试题难度按照最大最小值区间划分为n个档次,使得试题难度从标量转化为类别。对难度类别进行one

hot编码后得到试题难度向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试题难度增强的综合知识追踪方法,其特征在于,包括:由学生的历史答题记录数据与相应的试题数据构成的数据集,初始化定义学生的答题过程心理能力数据,经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度,对数据进行嵌入处理,最后使用深度学习方法训练知识追踪模型,得到每个学生的知识状态和优化后的心理能力数据并通过学生的知识状态和心理能力数据预测学生在未来试题上的表现。2.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,由学生的历史答题记录数据与相应的试题数据构成的数据集包括:试题号、试题得分情况以及每道试题所涉及的知识点;对于一个学生历史答题记录数据集D,包含了I名学生的集合S={s1,s2,

,s
i


,s
I
},包含了J道试题集合E={e1,e2,

,e
j


,e
J
}以及知识点集合K={k1,k2,

,k
m


,k
M
},每一道试题都被预先标注了所涉及的知识点,试题与知识点的联系通过Q矩阵来进行表示,Q∈R
J
×
M
,矩阵由0和1组成,Q
jm
=1表示试题e
j
涉及知识点k
m
反之则不涉及,其中学生的答题交互序列定义为x={(e1,C1,r1),(e2,C2,r2),

,(e
t
,C
t
,r
t
)},其中一个元组(e
t
,C
t
,r
t
)代表一个学习单元,其中e
t
代表试题,C
t
代表与试题e
t
相关的知识点集合,r
t
代表回答正确与否即r
t
∈{0,1},1代表回答正确,0代表回答错误。3.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,初始化定义学生的答题过程心理能力数据包括;初始化一个矩阵的矩阵,其中每一行就代表了一个学生的答题心理能力即学生s
t
的心理能力用向量来表示。4.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,经过数据处理后进行评估获得学生的答题能力以及试题和知识点难度,具体包括;学生s
i
做题能力g
i
的计算公式如下:其中E
i
是学生s
i
在学习过程中的试题序列,e
j
代表E
i
中的第j题,|E
i
|代表试题序列的长度,J代表试题数量,r
ij
∈{0,1}代表学生s
i
回答试题序列中试题e
j
正确与否;试题e
j
难度ed
j
的计算公式如下:其中S
j
代表回答过试题e
j
的学生集合,g
i
代表S
j
中的学生s
i
的做题能力,其中|S
j
|代表学生集合的长度,I代表总学生数量,r
ij
∈{0,1}代表学生s
i
回答试题e
j
正确与否;知识点k
m
难度kd
m
的计算公式如下:
其中E
m
代表涉及该知识点的试题的集合,|E
m
|代表集合长度,ed
j
代表E
m
中试题e
j
的试题难度,即知识点难度通过对涉及到该知识点的所有试题的难度求平均值计算得到。5.根据权利要求1所述的一种试题难度增强的综合知识追踪方法,其特征在于,对数据进行嵌入处理包括:对试题集合E进行one

hot编码,随后使用嵌入矩阵对试题向量进行Embedding操作,其中J代表试题的数量,d
e
代表Embedding后的试题向量维度,随后每个学习单元的试题e
t
就用向量来表示;对知识点集合K进行one

hot编码,随后使用嵌入矩阵对试题向量进行Embedding操作,其中M代表知识点的数量,d
k
代表Embedding后的知识点向量维度,随后每个知识点k
m
用向量k
m
表示,并且每个交互单元的试题e
t
所涉及的知识点集合C
t
就用集合中的知识点向量相加后表示,即知识点集合C
t
可以用向量来表示,公式如下:对试题难度按照最大最小值区间划分为n个档次,使得试题难度从标量转化为类别,对难度类别进行one

【专利技术属性】
技术研发人员:侯晨煜尤澳晨曹斌范菁
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1