用于在线学习平台的多任务注意力知识追踪方法及系统技术方案

技术编号：37453566 阅读：11 留言：0更新日期：2023-05-06 09:25

本发明专利技术公开了一种用于在线学习平台的多任务注意力知识追踪方法及系统，本发明专利技术包括根据历史交互序列提取当前时间步的不平衡感知注意力权重基于练习标签e

全部详细技术资料下载

【技术实现步骤摘要】
用于在线学习平台的多任务注意力知识追踪方法及系统

[0001]本专利技术涉及在线学习(e
‑
learning)平台
，具体涉及一种用于在线学习平台的多任务注意力知识追踪方法及系统。

技术介绍

[0002]随着电子学习的普及，学习者可以在不离开家的情况下通过自学来获取知识。为了为学习者制定个性化的学习计划，在线学习平台需要准确了解和掌握学习者各个阶段的知识水平。知识追踪(KT)是在线学习中的一项重要任务，其目标是通过分析学习者的学习历史数据来建模学习者的知识状态(KS)，即学习者对技能(或概念/知识成分)的掌握程度。在在线学习平台上，学习者可以通过完成特定的练习来学习相关技能(例如，如果“加法”是一项技能，那么“1+1”就是它的练习)，平台基于知识追踪模型追踪学习者关于学习技能的知识状态KS。最后，该平台通过何时停止策略来确定学习者是否掌握了这些技能。
[0003]近年来，基于深度学习的知识追踪方法(Deep Learning
‑
based Knowledge Tracing，DLKT)凭借其更强的表示能力，表现出优于传统模型的性能，如贝叶斯知识追踪，潜在因素模型和项目响应理论。例如，深度知识追踪(Deep Knowledge Tracing，DKT)，动态键值记忆网络(Dynamic Key
‑
Value Memory Networks，DKVMN)，自注意知识追踪(SAKT)。为了提高DLKT预测未来学习者响应的能力，我们挖掘了多个与学习相关的因素...

【技术保护点】

【技术特征摘要】
1.一种用于在线学习平台的多任务注意力知识追踪方法，其特征在于，包括：S101，根据历史交互序列S
t
提取当前时间步t的不平衡感知注意力权重S102，基于当前时间步t的练习标签e
t
、技能标签s
t
以及不平衡感知注意力权重编码得到练习嵌入x
t
；基于不平衡感知注意力权重以及当前时间步t响应标签r
t
、真实学习动作a
t
编码得到知识嵌入y
t
；S103，对练习嵌入x
t
、知识嵌入y
t
进行注意力知识追踪获得知识状态h
t
；S104，根据时间步t的练习嵌入x
t
、知识状态h
t
进行多任务预测获得对应的预测结果，所述多任务预测包括主任务和至少一项相关任务，所述主任务用于预测获得学习者正确响应练习标签e
t
的预测概率所述相关任务用于预测获得学习者针对练习标签e
t
提交答案时的使用次数或尝试次数。2.根据权利要求1所述的用于在线学习平台的多任务注意力知识追踪方法，其特征在于，步骤S101包括：S201，从历史交互序列中统计每个练习标签e的先验样本数#e；S202，使用log2(#e+1)函数对#e进行离散化处理；S203，将离散化处理后的先验样本数设置为练习标签e的不平衡因子；S204，使用独热编码对每个练习标签e的不平衡因子编码，得到不平衡因子向量o
#e
；S205，用所有练习标签e中最大的不平衡因子值对不平衡感知嵌入向量I的维度D
iam
进行初始化，并根据下式计算得到当前时间步t的不平衡感知注意力权重行初始化，并根据下式计算得到当前时间步t的不平衡感知注意力权重上式中，上标T表示不平衡感知嵌入向量I的转置操作，且不平衡感知嵌入向量I的数将在训练过程中通过梯度反向传播被自动学习。3.根据权利要求1所述的用于在线学习平台的多任务注意力知识追踪方法，其特征在于，步骤S102中编码得到练习嵌入x
t
的函数表达式为：上式中，Softmax表示Softmax激活函数，为技能标签s
t
的原始嵌入，为当前时间步t的不平衡感知注意力权重，为练习标签e
t
的标量困难度参数，为技能标签s
t
下所有练习构成的向量，是对应的偏置向量，D表示嵌入的维度，且有：有：有：上式中，和分别表示技能和练习的独热编码向量；和分别为和的嵌入矩阵；为的嵌入向量，E表示练习总数，S表示在线学习平台中技能标签的数量，D为嵌入维度。4.根据权利要求1所述的用于在线学习平台的多任务注意力知识追踪方法，其特征在于，步骤S102中编码得到知识嵌入y
t
的函数表达式为：
上式中，Softmax表示Softmax激活函数，为技能
‑
响应
‑
行动的双任务嵌入，为当前时间步t的不平衡感知注意力权重，为练习标签e
t
的标量困难度参数，为技能
‑
响应
‑
行动的变量向量，是对应的偏置向量，D表示嵌入的维度，且有：嵌入的维度，且有：嵌入的维度，且有：嵌入的维度，且有：上式中，为主任务的技能
‑
响应的原始嵌入，为相关任务的技能
‑
行动的原始嵌入，为主任务的技能
‑
响应变量嵌入向量，为相关任务的技能
‑
行动变量嵌入向量，和分别表示主任务和相关任务的技能感知注意力权重，o
s
为技能标签s的独热向量，和分别为用于获取主任务和相关任务的特征融合的权重向量，且有：重向量，且有：重向量，且有：重向量，且有：上式中，和分别表示技能
‑
响应和技能
‑
行动的多热编码向量；和分别为和的嵌入矩阵；和分别为和的嵌入矩阵，S表示在线学习平台中技能标签的数量，D为嵌入维度，技能
‑
响应的多热编码向量是将技能独热编码和响应的一位二进制编码0或1进行拼接得到；技能
‑
行动的多热编码向量是将技能独热编码和行动的二进制编码进行拼接，L为行动的二进制编码的位数是最大行动标签对应...

【专利技术属性】
技术研发人员：王挺，何亮亮，李骁，李莎莎，唐晋韬，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人