一种在交互式在线题库中预测学生表现的方法及设备技术

技术编号:31501789 阅读:20 留言:0更新日期:2021-12-22 23:20
一种在交互式在线题库中预测学生表现的方法,包括:一数据处理和特征提取模块,用于:从历史分数数据中提取统计学生特征,反映过去在问题上的学生表现;及统计问题特征,显示每个问题的受欢迎程度以及关于每个问题的平均学生分数;以及从指向装置移动数据中提取代表学生问题解决行为的特征的多个交互边特征;一个网络构建模块,用于:执行Edge2Node变换,将交互边特征变换为一个或多个交互节点;及构建学生

【技术实现步骤摘要】
一种在交互式在线题库中预测学生表现的方法及设备


[0001]本专利技术总体上涉及使用深度神经网络来预测学生在交互式问题中的测试表现的技术。

技术介绍

[0002]图神经网络(Graph Neural Network,GNN)是从广泛使用的卷积神经网络(Convolutional Neural Network,CNN)改编且被专门设计成用于图和图形数据的深度神经网络。它们在处理图中的复杂关系时展示强大的能力,并且一些代表性工作被记录在例如以下的论文中:Thomas N.Kipf和Max Welling的“利用图卷积网络的半监督分类(Semi

supervised Classification with Graph Convolutional Networks)”,《国际学习表征会议(The International Conference on Learning Representations)》,2017年;William L.Hamilton、Zhitao Ying和Jure Leskovec的“大型图的归纳表征学习(Inductive Representation Learning On Large Graphs)”,《神经信息处理系统会议(Conference on Neural Information Processing Systems)》,2017年;Michael Sejr Schlichtkrull、Thomas N.Kipf、Peter Bloem、Rianne van den Berg、Ivan Titov和Max Welling的“利用图卷积网络对关系数据进行建模(Modeling Relational Data With Graph Convolutional Networks)”,《扩展语义网会议(Extended Semantic Web Conference)》,第593至607页,2018年;Justin Gilmer、Samuel S.Schoenholz、Patrick F.Riley、Oriol Vinyals和George E.Dahl的“量子化学的神经消息传递(Neural Message Passing for Quantum Chemistry)”,《国际机器学习会议(The International Conference on Machine Learning)》,第1263至1272页,2017年;Yujia Li、Daniel Tarlow、Marc Brockschmidt和Richard S.Zemel的“门控图序列神经网络(Gated Graph Sequence Neural Networks)”,《国际学习表征会议(The International Conference on Learning Representations)》,2016年;以及Xiao Wang、Houye Ji、Chuan Shi、Bai Wang、Yanfang Ye、Peng Cui和Philip S.Yu的“异构图注意力网络(Heterogeneous Graph Attention Network)”,《万维网会议(The World Wide Web Conference)》,第2022至2032页,2019年。这些论文以全文引用的方式并入本文中。在这些论文当中,一些工作被专门设计成用于处理异构图,而其它工作旨在对具有多维边特征的图进行图卷积。然而,对于具有多维边特征的异构图的工作却很少。
[0003]GNN已应用于例如推荐系统、社交网络分析和分子性质预测等各种应用中。在在线学习和教育的领域中可能发现极少应用。Qian Hu和Huzefa Rangwala关于大学教育的最近工作“利用基于注意力的图卷积网络的学业表现估计(Academic performance estimation with attention

based graph convolutional networks)”,《教育数据挖掘(Education Data Mining)》,2019年,提出了一种被称为基于注意力的图卷积网络(Attention

based Graph Convolutional Network,AGCN)的基于GNN的方法,所述方法利用GCN来学习频繁获取的先前课程的网络的图嵌入,然后应用注意力机制来生成最终预测成绩的加权嵌入。然而,此方法限于处理仅具有一种类型的节点(即,课程)和边(即,连续两个学期所修课程的
连接)的图,此方法归因于交互式在线题库在问题和学生之间的本质上复杂的关系而无法应用于交互式在线题库中的学生表现预测。
[0004]学生表现预测是教育数据挖掘中的一项重要任务。例如,它可有助于推荐学习材料和提高在线学习平台中的学生保留率。根据在Qian Hu和Huzefa Rangwala的“利用基于注意力的图卷积网络的学业表现估计”,《教育数据挖掘》,2019年中记录的研究,关于学生表现预测的先前研究主要包含静态模型和顺序模型。并且静态模型是指学习学生特征的静态模式且进一步对学生表现进行预测的传统机器学习模型。另一方面,提出顺序模型以更好地捕获学生知识的时间演变或学习材料之间的基本关系。
[0005]循环神经网络(recurrent neural network,RNN)还可以用于从一系列学生问题解决记录中提取隐藏知识并且对学生的知识演变进行建模。然而,顺序模型无法直接应用于交互式在线题库中特定问题的学生表现预测,这是因为顺序模型旨在追踪学生在某一领域的知识演变并预测学生在所述领域的一系列问题中的表现。因此,如果这些顺序模型将用于预测问题层级表现,则每一领域可以仅由一个问题组成且因此追踪学生的知识演变不适用。在不具有学生知识水平的信息的情况下,预测变得不准确。
[0006]在Huan Wei、Haotian Li、Meng Xia、Yong Wang和Huamin Qu的“使用鼠标交互特征预测交互式在线题库中的学生表现(Predicting Student Performance in Interactive Online Question Pools Using Mouse Interaction Features)”,ArXiv:2001.03012,2020年中记录的最新研究通过基于学生鼠标移动交互引入新特征以划定问题之间的相似性来预测交互式在线题库中的学生表现。然而,此方法隐含地要求问题必须具有相似问题结构设计且涉及可能并不总是存在的鼠标拖放交互。
[0007]因此,对于交互式在线题库中的学生表现预测的更通用方法的需求尚未得到满足,所述方法可适用于具有数百或数千个不同类型问题的题库。

技术实现思路

[0008]根据本专利技术的各种实施例,提供一种基于新颖GNN的方法以预测交互式在线题库中的学生表现。该新颖GNN是残差关系图神经网络(residual relational graph 本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在交互式在线题库中预测学生成绩的方法,其特征在于,包括:执行一数据处理和特征提取逻辑过程执行模块,其包括:接收多个学生对具有多个问题的交互式在线题库中的多个历史学生问答分数数据记录;接收多个指向装置移动数据记录,所述多个指向装置移动数据记录含有对应于所述历史学生问答分数数据记录的由所述学生进行的一个或多个指向装置移动的数据;从所述历史学生问答分数数据记录中提取:统计学生特征,其反映所述学生过去在所述问题上的表现;及统计问题特征,其指示每个所述问题的受欢迎程度以及关于每个所述问题的平均学生分数;以及从所述指向装置移动数据记录中提取表示所述学生的问题解决行为的一个或多个特征的多个交互边特征;执行一节点网络构建逻辑过程执行模块,其包括:执行Edge2Node变换以将所述交互边特征变换为一个或多个交互节点;及构建来自所述统计学生节点特征的一个或多个学生节点、来自所述统计问题节点特征的一个或多个问题节点以及所述交互节点的异构学生

交互

问题(SIQ)网络;及执行一预测逻辑过程执行模块,其包括:通过残差关系图神经网络(R2GCN)处理所述SIQ网络,以预测所述学生在所述交互式在线题库中的一个或多个未尝试问题上的分数;其中所述R2GCN包括:一个或多个并行输入层,其用于将所述SIQ网络中的不同类型的节点成为相同形状的节点的特征变换;一个或多个后续关系图神经网络(R

GCN)层,其用于消息传递;与一个或多个隐藏状态、所述统计学生特征、所述统计问题特征和所述交互边特征的一个或多个残差连接,其用于捕获不同级别的信息;以及一个输出层,其用于所述学生在所述交互式在线题库中的所述未尝试问题上的分数的最终预测。2.根据权利要求1所述的方法,其特征在于,所述统计学生特征包括:所述学生对所述问题进行的总测验的次数;所述学生对所述问题进行的第二次测验的次数;所述学生在特定数学维度、等级和难度问题上的总测验百分比;以及所述学生在特定数学维度、等级和难度的问题上的第一次测验的平均分数。3.根据权利要求1所述的方法,其特征在于,所述统计问题特征包括:问题的数学维度;问题的等级;问题的难度;所述学生对问题进行的测验的总数;所述学生对问题进行的第二次测验的总数;以及在所述学生达到的每个分数级别中由所述学生对问题进行的测验百分比。
4.根据权利要求1所述的方法,其特征在于,所述交互式边特征包括:在第一次向所述学生展示问题时与在所述学生对所述问题进行第一次一般单击时之间的时间长度;所述第一次一般单击的时间长度占所述学生回答问题花费的总时间长度的百分比;在第一次向所述学生展示问题时以及在所述学生对所述问题进行第一次一般单击之前的指向装置移动事件的数目;在第一次向所述学生展示问题时以及在所述学生对所述问题进行第一次一般单击之前进行的指向装置移动事件的百分比;在所述第一次一般单击结束之前由所述学生对问题进行的所述指向装置移动事件的数目;对所述学生回答的问题进行的一般单击的总数;每秒对所述学生回答的问题进行的一般单击的平均数;对所述学生回答的问题进行的一般单击之间的平均时间长度;对所述学生回答的问题进行的一般单击之间的中值时间长度;对所述学生回答的问题进行的一般单击之间的时间长度标准偏差;由所述学生产生的总指向装置轨迹长度;以及所述学生回答问题的时间点;其中一般单击属于当所述学生正与问题交互时在指向装置移动轨迹中的一对必要的指向装置移动事件。5.根据权利要求1所述的方法,其特征在于,所述R2GCN进一步包括:消息函数,其用于在所述消息传递中从所述SIQ网络的所有相邻节点到中心节点传输和聚合消息;一平均函数,其用于减少在相同类型的边上传输的消息;一求和函数,其用于减少在不同类型的边上传输的消息;一更新函数,其用于在每个所述R

GCN层之后更新中心节点的隐藏状态;以及一读出函数,其用于将最终隐藏状态变换成所述最终预测。6.一种用于预测交互式在线题库中的学生...

【专利技术属性】
技术研发人员:李昊天王勇危欢屈华民
申请(专利权)人:香港科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1