答题行为推荐方法技术

技术编号:29584865 阅读:37 留言:0更新日期:2021-08-06 19:43
本申请公开了一种答题行为推荐方法。其中,该方法包括:获取目标对象在不同时刻作答与目标知识点相关联的习题的对应的得分;将得分输入至认知跟踪模型中,得到目标对象在不同时刻对目标知识点的目标认知状态值;将当前决策时间对应的目标认知状态值输入至目标知识点对应的目标模型中,得到推荐目标对象继续作答目标试题的次数,其中,当前决策时间为答题的开始时刻,目标模型包括:答题行为强化学习EBQ模型,本申请解决了由于相关技术中尚未有研究追踪学生的动态认知状态,并基于动态的认知状态,针对学生用户是否需要进行相关试题练习,并进行多少道相关习题练习的答题行为进行推荐的技术问题。

【技术实现步骤摘要】
答题行为推荐方法
本申请涉及习题推荐领域,具体而言,涉及一种答题行为推荐方法。
技术介绍
随着教育信息化的持续深入以及互联网的迅猛发展,在线教育已成为计算机融合传统教育领域而形成的一个新的重要研究和应用方向。现有的推荐系统局限于给学生用户推荐内容相关的习题。然而,学生用户在处于动态变化的认知状态时,是否需要进行相关习题练习、进行多少相关习题练习的答题行为推荐具有研究意义和应用价值。尤其是在当前大多数学生都采用题海战术的情况下,如何在不同的阶段高效地选择正确的答题行为有利于提高学习效率。相关技术中,尚未有研究追踪学生的动态认知状态,并基于动态的认知状态,针对学生用户是否需要进行相关习题练习、进行多少道相关习题练习的答题行为进行推荐。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种答题行为推荐方法,以至少解决由于相关技术中尚未有研究追踪学生的动态认知状态,并基于动态的认知状态,针对学生用户是否需要进行相关试题练习,并进行多少道相关习题练习的答题行为进行推荐的技术问题。根据本文档来自技高网...

【技术保护点】
1.一种答题行为推荐方法,其特征在于,包括:/n获取目标对象在不同时刻作答与目标知识点相关联的习题的对应的得分;/n将所述得分输入至认知跟踪模型中,得到所述目标对象在所述不同时刻对所述目标知识点的目标认知状态值;/n将当前决策时间对应的目标认知状态值输入至所述目标知识点对应的目标模型中,得到推荐所述目标对象继续作答目标试题的次数,其中,所述当前决策时间为答题的开始时刻,所述目标模型包括:答题行为强化学习EBQ模型,所述EBQ模型用于表示至少一个认知状态值,以及推荐继续作答与所述目标知识点相关习题的次数值的关系,所述目标试题为与目标知识点相关的多个不同的试题。/n

【技术特征摘要】
1.一种答题行为推荐方法,其特征在于,包括:
获取目标对象在不同时刻作答与目标知识点相关联的习题的对应的得分;
将所述得分输入至认知跟踪模型中,得到所述目标对象在所述不同时刻对所述目标知识点的目标认知状态值;
将当前决策时间对应的目标认知状态值输入至所述目标知识点对应的目标模型中,得到推荐所述目标对象继续作答目标试题的次数,其中,所述当前决策时间为答题的开始时刻,所述目标模型包括:答题行为强化学习EBQ模型,所述EBQ模型用于表示至少一个认知状态值,以及推荐继续作答与所述目标知识点相关习题的次数值的关系,所述目标试题为与目标知识点相关的多个不同的试题。


2.根据权利要求1所述的方法,其特征在于,所述EBQ模型包括:强化学习算法中的Q矩阵,其中,所述认知状态值个数与所述Q矩阵行元素的个数对应,所述推荐继续作答与所述目标知识点相关习题的次数值的个数与所述Q矩阵列的个数对应,得到推荐所述目标对象继续作答与所述目标知识点相关试题的次数,包括:
根据所述认知跟踪模型确定当前决策时间对应的当前认知状态值;
确定所述当前认知状态值对应的所述Q矩阵的行,并获取该行中的最大状态值;
确定所述最大状态值对应的所述Q矩阵的列,将该列对应的所述推荐继续作答与所述目标知识点相关习题的次数作为所述目标对象继续作答与所述目标知识点相关试题的次数。


3.根据权利要求2所述的方法,其特征在于,所述Q矩阵通过以下方式确定:
获取零矩阵,其中,所述零矩阵为矩阵所有元素均为零的矩阵;
至少基于所述认知跟踪模型、所述EBQ模型对应的奖励模型更新所述零矩阵得到所述Q矩阵。


4.根据权利要求3所述的方法,其特征在于,获取零矩阵,包括:
确定动态认知状态集合,以及动作空间集合,其中,所述动态认知状态集合包括:多个初始认知状态值;所述动作空间集合包括:多个不同初始动作次数值,其中,所述初始动作次数用于指示目标对象继续作答与目标知识点相关试题的次数;
确定所述多个初始认知状态值的个数为所述零矩阵行的个数,确定所述多个动作次数值的个数为所述零矩阵列的个数构建零矩阵。


5.根据权利要求3所述的方法,其特征在于,至少基于所述认知跟踪模型、所述EBQ模型对应的奖励模型更新所述零矩阵得到所述Q矩阵:
将多个样本对象对应的样本分数输入至所述认知跟踪模型,确定多个样本对象在不同时刻对应的样本认知状态值,其中,所述样本认知状态值包括:第一决策时间对应的第一认知状态值以及第二决策时间对应的第二认知状态值,其中,所述第一决策时间为与所述第二决策时间相邻,且为在所述第二决策时间之前的决策时刻;
确定所述EBQ模型对应的奖励模型,获取所述奖励模型对应的势能差,基于所述势能差和所述第一认知状态值与所述第二认知状态值更新所述零矩阵得到所述Q矩阵。


6.根据权利要求5所述的方法,其特征在于,获取所述奖励模型对应的势能差,基于所述势能差和所述第一认知状态值与所述第二认知状态值更新所述...

【专利技术属性】
技术研发人员:刘菲卜晨阳孙帅胡学钢
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1