【技术实现步骤摘要】
知识追踪模型训练方法、追踪方法、装置、设备及介质
[0001]本专利技术涉及知识追踪领域,尤其涉及一种知识追踪模型训练方法、追踪方法、装置、设备及介质。
技术介绍
[0002]知识追踪任务是指根据学生历史答题记录追踪学生知识状态的变化,预测学生未来的答题情况。
[0003]但是,现有知识追踪任务大多只考虑了单一知识点题目的情况,导致题目涉及到多个知识点时难以进行有效的知识追踪。
技术实现思路
[0004]有鉴于此,本专利技术提供一种知识追踪模型训练方法、追踪方法、装置、设备及介质,用于改善多知识点题目难以进行有效的预测的现状。
[0005]第一方面,本专利技术实施例提供一种知识追踪模型训练方法,包括:从训练集中获取预设数量个样本,其中,所述预设数量个样本包括每个时刻的题目、回答及所述题目对应的至少一个知识点;将每个所述样本输入至预设模型的第一嵌入层,以将每个所述样本的回答和每个所述样本的题目对应的知识点分别转换为回答嵌入向量和知识点嵌入向量;利用所述预设模型的题目嵌入层计算所述题目对应的每个所 ...
【技术保护点】
【技术特征摘要】
1.一种知识追踪模型训练方法,其特征在于,包括:从训练集中获取预设数量个样本,其中,所述预设数量个样本包括每个时刻的题目、回答及所述题目对应的至少一个知识点;将每个所述样本输入至预设模型的第一嵌入层,以将每个所述样本的回答和每个所述样本的题目对应的知识点分别转换为回答嵌入向量和知识点嵌入向量;利用所述预设模型的题目嵌入层计算所述题目对应的每个所述知识点嵌入向量的权重,并对每个所述知识点嵌入向量和每个所述知识点嵌入向量的权重进行加权求和,得到所述样本的题目对应的题目嵌入向量;基于所述预设模型的编码器层,将每个所述样本对应的题目嵌入向量和回答嵌入向量进行编码,得到所述预设数量个样本对应的每个时刻的编码结果;将所述每个时刻的编码结果输入至所述预设模型的预测层,得到每个所述样本的回答正确预测概率;根据每个样本的回答和回答正确预测概率计算损失函数值,并利用所述损失函数值更新所述预设模型,得到知识追踪模型。2.根据权利要求1所述的知识追踪模型训练方法,其特征在于,所述利用所述预设模型的题目嵌入层计算所述题目对应的每个所述知识点嵌入向量的权重,并对每个所述知识点嵌入向量和每个所述知识点嵌入向量的权重进行加权求和,得到所述样本的题目对应的题目嵌入向量,包括:利用所述预设模型的题目嵌入层将所述题目对应的每个所述知识点嵌入向量分别映射为多个空间的第一查询表示、第一键表示及第一值表示;针对每个知识点嵌入向量的每个空间,根据其中一个知识点嵌入向量的第一查询表示和其中另一个知识点嵌入向量的第一键表示的向量内积,确定每个所述知识点嵌入向量在所述空间的相关度;利用所述相关度,计算每个所述知识点嵌入向量在每个所述空间的第一权重;针对每个空间,将每个所述样本的题目对应的知识点嵌入向量的第一值表示和所述知识点嵌入向量的第一权重进行加权求和,得到每个所述知识点嵌入向量的知识点表示;将所述知识点嵌入向量在所述每个空间的知识点表示连接,得到知识点融合表示;将所述样本的题目对应的每个知识点嵌入向量的知识点融合表示相加,得到题目嵌入向量。3.根据权利要求1所述的知识追踪模型训练方法,其特征在于,所述题目嵌入层包括依次相连的全局池化层和两层全连接层;所述利用所述预设模型的题目嵌入层计算所述题目对应的每个所述知识点嵌入向量的权重,并对每个所述知识点嵌入向量和每个所述知识点嵌入向量的权重进行加权求和,得到所述样本的题目对应的题目嵌入向量,包括:将所述题目对应的每个所述知识点嵌入向量输入至所述全局池化层以进行压缩;利用所述两层全连接层将所述题目对应的压缩后的知识点嵌入向量进行维度缩减和扩展,得到每个所述知识点嵌入向量的第二权重;对所述题目对应的每个所述知识点嵌入向量和所述知识点嵌入向量的第二权重的进行加权求和,得到所述样本的题目对应的题目嵌入向量。
4.根据权利要求1所述的知识追踪模型训练方法,其特征在于,所述利用所述预设模型的题目嵌入层计算所述题目对应的每个所述知识点嵌入向量的权重,并对每个所述知识点嵌入向量和每个所述知识点嵌入向量的权重进行加权求和,得到所述样本的题目对应的题目嵌入向量之后,所述基于所述预设模型的编码器层,将每个所述样本对应的题目嵌入向量和回答嵌入向量进行编码,得到所述预设数量个样本对应的每个时刻的编码结果之前,所述方法还包括:根据所述训练集中的所有样本,基于第一预设算式确定每个所述样本的题目的难度系数,其中,所述第一预设算式包括:式中,d表示难度系数,N
fail
和N
ans
分别表示训练集的所有样本中,所述难度系数对应的题目的回答为错误的样本的数量,和包含所述难度系数对应的题目的样本的数量;利用第二预设算式,计算每个所述题目的难度系数对应的难度因子,其中,所述第二预设算式包括:式中,b表示难度因子,W
2b
、W
1b
、b
1b
、b
2b
均表示所述难度因子的训练参数;将所述样本的题目对应的初始题目嵌入向量和难度因子相加,得到所述样本的优化后的题目嵌入向量;所述基于所述预设模型的编码器层,将每个所述样本对应的题目嵌入向量和回答嵌入...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。