【技术实现步骤摘要】
一种基于深度强化学习的群体教学推荐系统
[0001]本专利技术涉及教育和信息
,具体涉及一种基于深度强化学习的群体教学推荐系统。
技术介绍
[0002]在传统的课堂教学中,教师往往根据经验来安排学习内容,因为学生的学习细节是看不见的,不受控制的。当然,老师可能会有各种各样的信息,包括问答、课堂评估,以及学生的面部表情、手势和身体动作,以评估学生的学习表现。但这些信息往往是粗略的,不能涵盖每个学生或跟踪每个人的学习细节,这使得教师往往无法在细粒度上设计教学路径。教学辅助系统的发展,缓解了教师所面临的困难。教学辅助系统提供了多样的师生交互方法,并可以记录交互信息,教师可以通过这些交互信息来更加精确深入的了解学生情况。另一方面,教学辅助系统还可以为教师或学生提供推荐的教学计划或学习计划,更大程度缓解教师的工作压力。
[0003]公开号为CN 112700688A的专利申请公开了一种智能课堂教学辅助系统。通过课堂的投票等交互方法采集学生学习数据,再以这些数据为基础对学生进行建模追踪,最后根据全班学生的模型给出推荐的教学 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的群体教学推荐系统,其特征在于,包括:用户终端、知识点管理模块,学生数据管理模块,学生模型模块,预训练模块和群体教学推荐模块;所述用户终端用于教师或学生登录系统,为用户与系统的交互输入和输出终端;所述知识点管理模块用于教师用户录入知识点数据,并将知识点数据发送至学生模型模块和预训练模块群体教学推荐模块;所述学生数据管理模块用于学生用户录入学生基础数据,并将学生基础数据发送至学生模型模块;以及用于在课堂中采集学生课堂反馈并发送给群体教学推荐模块;所述学生模型模块根据预置的创建策略,基于当前录入的知识点数据和学生基础数据创建学生模型并发送至预训练模块;所述预训练模块以学生模型模块创建的学生模型为学习主体,以知识点管理模块和学生数据管理模块发送的数据为训练数据,对预置的初始群体推荐模型进行训练,得到训练好的群体推荐模型;所述初始群体推荐模型包括第一神经网络模型和第二神经网络模型,所述第一和第二神经网络模型包括输入层、至少一层隐藏层和输出层,其中,输入层为学生课堂反馈数据序列,隐藏层为能够处理序列输入的神经网络,第一神经网络模型的输出层用于输出当前课程的各知识点的推荐度;第二神经网络模型的输出层用于输出当前课堂教学的评价值;所述群体教学推荐模块调用预训练模块训练好的群体推荐模型,在课程教学过程中结合课程的每一堂课的学生课堂反馈输出教学推荐信息并发送给对应的教师用户;以及保存生数据管理模块采集的学生课堂反馈;在课程教学过程中按照配置的模型更新周期,基于当前周期保存的学生课堂反馈对群体推荐模型进行更新训练;输出教学推荐信息包括下一堂课的推荐知识点和当前学生课堂反馈数据序列的评价值,其中下一堂课的推荐知识点为推荐度最大的知识点。2.如权利要求1所述的群体教学推荐系统,其特征在于,所述知识点数据包括:知识点ID,所属课程名称,知识点名称,知识点简介,知识点内容,知识点难度系数,该知识点的前置知识点ID,该知识点配套的课堂测试题目,以及知识点相关资料。3.如权利要求1所述的群体教学推荐系统,其特征在于,所述学生基础数据包括:学生的学号,姓名,年龄,性别,年纪和学生类型;所述学生课堂反馈包括的数据有:测试题目名称,所属知识点ID,测试题目内容,参与测试学生ID和学生测试结果等。4.如权利要求1所述的群体教学推荐系统,其特征在于,所述学生模型模块使用学生模型模拟真实学生参与预训练模块中的群体推荐模型训练过程,所述学生模型的构建模型为艾宾浩斯记忆模型,半衰期记忆模型或贝叶斯知识追踪模型;且所述模型的描述包括:描述虚拟学生当前对于每个知识点的掌握状态;描述虚拟学生如何通过学习从一个状态转变为另一个状态的过程;描述学习后的课堂反馈。5.如权利要求1所述的群体教学推荐系统,其特征在于,所述预训练模块对所述初始群体推荐模型的训练包括:以学生模型模块创建的学生模型作为虚拟学生组成一个班级参与训练;设定课程要求信息,以及初始所述初始群体推荐模型的网络参数;
以全班的虚拟学生作为环境,初始群体推荐模型的第一神经网络模型和第二神经网络模型作为智能体,采用近端策略优化算法对智能体进行训练,当满足预设的训练结束条件时,保存当前的网络参数,得到训练好的群体推荐模型。6.如权利要求5所述的群体教学推荐系统,其特征在于,所述课程要求信息包括:课时数,以及课程结束时需要达到的及格率,优秀率和平均分。7.如权利要求1所述的群体教学推荐系统,其特征在于,采用近端策略优化算法对智能体进行训练包括:步骤S1:记录虚拟学生的初始状态;步骤S2:判断第一循环次数是否达到预置的第一最大循环次数,若是,则执行步骤S3;否则,循环执行下列处理:步骤S201:将虚拟学生状态重置为步骤S1中记录的初始状态;步骤S202:循环执行步骤S202
‑
1至步骤S202
‑
4,直到循环次数达到预置的最大子循环次数;记录每个循环中虚拟学生的学生课堂反馈,第一神经网络模型输出的知识点的推荐度,第二神经网络模型输出的评价值,以及通过所有虚拟学生的课堂反馈根据课程要求...
【专利技术属性】
技术研发人员:杨腾杰,左琳,陈柯弟,刘念伯,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。