一种基于HyperMixer的知识追踪方法技术

技术编号：41275181 阅读：6 留言：0更新日期：2024-05-11 09:27

本发明专利技术涉及深度学习技术领域，尤其涉及一种基于HyperMixer的知识追踪方法。通过HyperMixer架构独特的混合特征层，能够在不同任务中取得出色的性能表现，能够在全局范围内混合特征信息，使得模型不仅能够捕捉长范围的依赖关系，还能维持局部特征的细节处理。旨在解决如何使得模型不仅能够捕捉长范围的依赖关系，还能维持局部特征的细节处理的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习，尤其涉及一种基于hypermixer的知识追踪方法。

技术介绍

1、随着人工智能技术的不断发展，智慧教育也成为研究者们关注的话题。深度学习的火热为技术在教育中的应用带来了新的契机，各种神经网络在教育智能算法中的使用成为了当下的研究热门。

2、知识追踪任务是智慧教育研究中的重要部分，该技术旨在通过学生的历史交互记录预测学生在未来的表现，这些交互记录通常是学习者在过去对习题进行作答的情况，通过该技术，教师和学习者所使用的学习平台得以掌握当前学习者的知识状态，并通过该知识状态诊断学生对哪些知识点还掌握不足，从而主动地调整接下来的教学策略或学习路径。

3、从序列建模的角度看，现有的知识追踪方法可大体分为基于循环神经网络的方法和基于transformer的方法。这些方法遵循了其他序列任务相同的设定，它们都将历史信息使用编码器进行编码，再选择对应时间步的隐藏状态进行预测。

4、然而，编码器在处理历史信息时，历史信息可能会丢失一些重要的细节或上下文信息，容易导致编码器丢失一些序列数据中的局部特征细节；并且在选择对应时间步的隐藏状态进行预测时，模型可能过于依赖近期的历史信息，而无法捕捉远期的信息，导致无法捕捉序列数据中的长范围依赖关系。

5、上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

1、本专利技术的主要目的在于提供一种基于hypermixer的知识追踪方法，旨在解决如何使得模型

2、为实现上述目的，本专利技术提供的一种基于hypermixer的知识追踪方法，所述方法包括：

3、获取学习者在目标时刻对应的交互序列；

4、确定所述交互序列中的练习标签、知识点标签和作答情况标签；

5、对所述练习标签、所述知识点标签和所述作答情况标签进行嵌入；

6、基于hypermixer全局特征混合器捕捉嵌入后的所述交互序列中的序列全长特征；以及，

7、基于hypermixe局部特征混合器捕捉嵌入后的所述交互序列中预设历史时间段内的交互特征；

8、融合所述序列全长特征和所述交互特征，得到特征混合器结果，并根据所述特征混合器结果预测下一时刻所述学习者的练习结果、知识点结果和作答情况结果。

9、可选地，所述对所述练习标签、所述知识点标签和所述作答情况标签进行嵌入的步骤包括：

10、对所述交互序列中的每一所述练习标签进行嵌入，得到嵌入矩阵，其中，为所述学习者的练习总个数，d表示嵌入维度；

11、对所述交互序列中的每一所述知识点标签进行嵌入，得到嵌入矩阵，其中，为所述学习者的知识点总个数，d表示嵌入维度；

12、对作答情况进行嵌入，得到嵌入矩阵。

13、可选地，所述基于hypermixer全局特征混合器包括全局序列混合器和全局通道混合器，所述基于hypermixer全局特征混合器捕捉嵌入后的所述交互序列中的序列全长特征的表达式为：

14、

15、其中，

16、

17、

18、式中，为嵌入后的所述交互序列中的所有特征，和分别是sequence mixer和channel mixer的权重矩阵，和为偏置向量，gelu为非线性激活函数，表示序列混合器和全局通道混合器的输入。

19、可选地，所述和所述由参数化函数生成，通过另一个mlp独立地从每个token中生成权重矩阵：

20、

21、式中，是通过位置编码附加信息的向量，表示多层感知机制。

22、可选地，所述基于hypermixe局部特征混合器包括局部序列混合器和局部通道混合器，所述基于hypermixe局部特征混合器捕捉嵌入后的所述交互序列中预设历史时间段内的交互特征的步骤包括：

23、

24、其中，为所述交互序列中预设历史时间段内的交互特征，

25、

26、

27、式中，和分别是和channel mixer的权重矩阵，和为偏置向量，gelu为非线性激活函数。

28、可选地，所述和所述由参数化函数生成，通过另一个mlp独立地从每个token中生成权重矩阵：

29、

30、式中，是通过位置编码附加信息的向量，表示多层感知机制。

31、可选地，述融合所述序列全长特征和所述交互特征，得到特征混合器结果，并根据所述特征混合器结果预测下一时刻所述学习者的练习结果、知识点结果和作答情况结果的步骤包括：

32、将所述序列全长特征和所述交互特征进行拼接，得到拼接特征：

33、；

34、将所述拼接特征作为当前时刻的序列特征，预测下一时刻的练习结果、知识点结果和作答情况结果；

35、<msub><mover><mi>y</mi><mo stretchy="true">̂</mo></mover><mn>1</mn></msub><mi>=σ(</mi><msub><mi>w</mi><mn>5</mn></msub><mi>[</mi><msub><mi>h</mi><mi>t</mi></msub><mi>⊕</mi><msub><mi>q</mi><mi>t+1</mi></msub><mi>]+</mi><msub><mi>w</mi><mn>5</mn></msub><mi>)</mi>

36、<msub><mover><mi>y</mi><mo stretchy="true">̂</mo></mover><mn>2</mn></msub><mi>=σ(</mi><msub><mi>w</mi><mn>6</mn></msub><mi>[</mi><msub><mi>h</mi><mi>t</mi></msub><本文档来自技高网...

【技术保护点】

1.一种基于HyperMixer的知识追踪方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述对所述练习标签、所述知识点标签和所述作答情况标签进行嵌入的步骤包括：

3.如权利要求1所述的方法，其特征在于，所述基于HyperMixer全局特征混合器包括全局序列混合器和全局通道混合器，所述基于HyperMixer全局特征混合器捕捉嵌入后的所述交互序列中的序列全长特征的表达式为：

4.如权利要求3所述的方法，其特征在于，

5.如权利要求1所述的方法，其特征在于，所述基于HyperMixe局部特征混合器包括局部序列混合器和局部通道混合器，所述基于HyperMixe局部特征混合器捕捉嵌入后的所述交互序列中预设历史时间段内的交互特征的步骤包括：

6.如权利要求5所述的方法，其特征在于，

7.如权利要求1所述的方法，其特征在于，所述融合所述序列全长特征和所述交互特征，得到特征混合器结果，并根据所述特征混合器结果预测下一时刻所述学习者的练习结果、知识点结果和作答情况结果的步骤包括：

9.一种基于HyperMixer的知识追踪系统，其特征在于，所述基于HyperMixer的知识追踪系统包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于HyperMixer的知识追踪程序，所述基于HyperMixer的知识追踪程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于HyperMixer的知识追踪方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于HyperMixer的知识追踪程序，所述基于HyperMixer的知识追踪程序被处理器执行时实现如权利要求1至8中任一项所述的基于HyperMixer的知识追踪方法的步骤。

...

【技术特征摘要】

1.一种基于hypermixer的知识追踪方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述对所述练习标签、所述知识点标签和所述作答情况标签进行嵌入的步骤包括：

3.如权利要求1所述的方法，其特征在于，所述基于hypermixer全局特征混合器包括全局序列混合器和全局通道混合器，所述基于hypermixer全局特征混合器捕捉嵌入后的所述交互序列中的序列全长特征的表达式为：

4.如权利要求3所述的方法，其特征在于，

5.如权利要求1所述的方法，其特征在于，所述基于hypermixe局部特征混合器包括局部序列混合器和局部通道混合器，所述基于hypermixe局部特征混合器捕捉嵌入后的所述交互序列中预设历史时间段内的交互特征的步骤包括：

6.如权利要求5所述的方法，其特征在于，

7.如权利要求1所述的方法，其特征在于，所述融合所述序列全长特征和所述交互特征，得到特征混合器结果，并根据所述特征混合器结果预...

【专利技术属性】
技术研发人员：王俊，陈恳，李子杰，王明杰，夏跃龙，邹伟，周菊香，甘健侯，
申请(专利权)人：云南师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人