基于习题感知的动态采样方法及装置制造方法及图纸

技术编号:39410411 阅读:8 留言:0更新日期:2023-11-19 16:02
本发明专利技术提供一种基于习题感知的动态采样方法及装置,获取与用户对应的各个交互习题

【技术实现步骤摘要】
基于习题感知的动态采样方法及装置


[0001]本专利技术涉及机器学习和数据挖掘
,特别是涉及一种基于习题感知的动态采样方法及装置


技术介绍

[0002]智能在线教育系统中,学习者认知状态的诊断是一项非常重要且值得深入研究的任务,旨根据交互结果
(
答对或答错
)
来评估学习者对各个知识点的掌握程度,该交互结果由学习者在以往跟测试项目
(
习题
)
进行交互所产生

[0003]认知诊断任务要求有足够且能真实反应学习者能力的交互过程对应的数据,从而提供充足且可靠的监督信号

但是在实际的智能教育系统中的交互数据往往呈长尾分布,大部分学习者仅跟少量的测试项目有过交互,并且所记录的交互数据不一定能反映出学习者的真实能力,导致有效的监督信息不足


技术实现思路

[0004]有鉴于此,本专利技术提供一种基于习题感知的动态采样方法及装置,通过采样信息量丰富的未交互习题来构建交互习题与未交互习题之间的偏序关系,以解决监督信息不足的问题

[0005]一种基于习题感知的动态采样方法,包括:
[0006]获取与用户对应的各个交互习题

所述交互习题对应的交互习题作答情况以及未交互习题;
[0007]基于预先训练的习题作答评估模型,评估所述用户在每个所述未交互习题上作答的未交互习题作答情况;
[0008]确定每个所述未交互习题对应的习题特征;
[0009]依据每个所述未交互习题对应的习题特征和已交互习题对应的习题特征,确定每个所述未交互习题与已交互习题之间的特征相似度;
[0010]基于所述特征相似度确定未交互习题样本的抽样概率,并利用所述可抽样概率选取多个未交互习题作为未交互习题样本;
[0011]基于预设目标函数的梯度大小来衡量各个所述未交互习题样本对应的各个信息量,确定各个所述信息量对应的数值大小;
[0012]按照各个所述信息量由大到小的顺序对各个所述未交互习题样本进行排列,并按照各个所述信息量由大到小的顺序,依次采样预设数量的未交互习题样本;
[0013]构建每个所述交互习题作答情况与所述预设数量的未交互习题样本对应的未交互习题样本作答情况之间的偏序关系

[0014]上述的方法,可选的,所述习题作答评估模型的训练,包括:
[0015]获取各个交互习题样本

未交互习题样本和每个所述交互习题样本对应的交互习题样本作答情况;
[0016]确定预设的习题矩阵,所述习题矩阵包括各个习题数据,每个所述习题数据通过将每个交互习题样本和未交互习题样本分别与各个知识点进行关联所得;
[0017]依据各个所述知识点,确定各个所述交互习题样本中与每个所述未交互习题样本对应的各个目标交互习题样本;
[0018]依据各个所述目标交互习题样本对应的目标交互习题样本作答情况,评估该未交互习题样本对应的预测作答情况;
[0019]在获取每个所述未交互习题样本对应的真实作答情况后,利用第一预设损失函数,计算每个所述预测作答情况与所述真实作答情况之间的第一损失结果;
[0020]依据所述第一损失结果,对所述习题作答评估模型进行迭代训练

[0021]上述的方法,可选的,所述依据各个所述知识点,确定各个所述交互习题样本中与每个所述未交互习题样本对应的各个目标交互习题样本,包括:
[0022]在所述习题矩阵中,确定每个所述未交互习题样本所关联的各个第一知识点以及每个所述交互习题样本所关联的各个第二知识点;
[0023]在各个所述交互习题样本所关联的各个第二知识点中,查找与每一所述未交互习题样本所关联的每个第一知识点一致的目标知识点;
[0024]依据各个所述目标知识点,确定与每个所述目标知识点对应的各个交互习题样本为目标交互习题样本

[0025]上述的方法,可选的,所述基于预先训练的习题作答评估模型,评估所述用户在每个所述未交互习题上作答的未交互习题作答情况,包括:
[0026]将各个所述交互习题

所述交互习题作答情况以及未交互习题输入至预先训练的习题作答评估模型,评估各个所述未交互习题对应的未交互习题作答情况

[0027]上述的方法,可选的,所述确定每个所述未交互习题对应的习题特征,包括:
[0028]确定每个所述未交互习题中包括的各个习题知识点,基于这些习题知识点,以确定该未交互习题对应的习题区分度;
[0029]分析每个所述未交互习题中包括的各个习题知识点对应的知识点难度,以确定该未交互习题对应的习题难度;
[0030]将每个所述习题区分度和习题难度进行集合,以得到每个未交互习题对应的习题特征

[0031]上述的方法,可选的,所述依据每个所述习题特征,确定每个所述未交互习题与已交互习题之间的特征相似度,包括:
[0032]调用预设的相似度算法;
[0033]将每个所述未交互习题对应的习题特征输入至所述相似度算法,计算该未交互习题与已交互习题之间的特征相似度

[0034]上述的方法,可选的,所述构建每个所述交互习题作答情况与所述预设数量的未交互习题样本对应的未交互习题样本作答情况之间的偏序关系,包括:
[0035]获取所述预设数量的未交互习题样本对应的未交互习题样本作答情况;
[0036]依据各个交互习题作答情况和所述未交互习题样本作答情况,将各个所述交互习题划分为各个交互正样本和交互负样本,将所述预设数量的未交互习题样本划分为各个未交互正样本和未交互负样本;
[0037]按照单调性理论,估计每个所述未交互正样本与所述交互负样本对应的偏序对,以及每个所述交互正样本与所述未交互负样本对应的偏序对,以确定每个所述未交互正样本与所述未交互正样本之间的偏序关系

[0038]一种基于习题感知的动态采样装置,包括:
[0039]获取模块,用于获取与用户对应的各个交互习题

所述交互习题对应的交互习题作答情况以及未交互习题;
[0040]评估模块,用于基于预先训练的习题作答评估模型,评估所述用户在每个所述未交互习题上作答的未交互习题作答情况;
[0041]确定模块,用于确定每个已交互习题对应的已交互习题特征和每个所述未交互习题对应的未交互习题特征;
[0042]选取模块,用于依据每个所述已交互习题特征和所述未交互习题特征,确定每个所述未交互习题与已交互习题之间的特征相似度,基于所述特征相似度确定未交互习题样本的抽样概率,并利用所述抽样概率选取多个未交互习题作为未交互习题样本;
[0043]处理模块,用于基于预设目标函数的梯度大小来衡量各个所述未交互习题样本对应的各个信息量,确定各个所述信息量对应的数值大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于习题感知的动态采样方法,其特征在于,包括:获取与用户对应的各个交互习题

所述交互习题对应的交互习题作答情况以及未交互习题;基于预先训练的习题作答评估模型,评估所述用户在每个所述未交互习题上作答的未交互习题作答情况;确定每个所述未交互习题对应的习题特征;依据每个所述未交互习题对应的习题特征和已交互习题对应的习题特征,确定每个所述未交互习题与已交互习题之间的特征相似度;基于所述特征相似度确定未交互习题样本的抽样概率,并利用所述可抽样概率选取多个未交互习题作为未交互习题样本;基于预设目标函数的梯度大小来衡量各个所述未交互习题样本对应的各个信息量,确定各个所述信息量对应的数值大小;按照各个所述信息量由大到小的顺序对各个所述未交互习题样本进行排列,并按照各个所述信息量由大到小的顺序,依次采样预设数量的未交互习题样本;构建每个所述交互习题作答情况与所述预设数量的未交互习题样本对应的未交互习题样本作答情况之间的偏序关系
。2.
根据权利要求1所述的方法,其特征在于,所述习题作答评估模型的训练,包括:获取各个交互习题样本

未交互习题样本和每个所述交互习题样本对应的交互习题样本作答情况;确定预设的习题矩阵,所述习题矩阵包括各个习题数据,每个所述习题数据通过将每个交互习题样本和未交互习题样本分别与各个知识点进行关联所得;依据各个所述知识点,确定各个所述交互习题样本中与每个所述未交互习题样本对应的各个目标交互习题样本;依据各个所述目标交互习题样本对应的目标交互习题样本作答情况,评估该未交互习题样本对应的预测作答情况;在获取每个所述未交互习题样本对应的真实作答情况后,利用第一预设损失函数,计算每个所述预测作答情况与所述真实作答情况之间的第一损失结果;依据所述第一损失结果,对所述习题作答评估模型进行迭代训练
。3.
根据权利要求2所述的方法,其特征在于,所述依据各个所述知识点,确定各个所述交互习题样本中与每个所述未交互习题样本对应的各个目标交互习题样本,包括:在所述习题矩阵中,确定每个所述未交互习题样本所关联的各个第一知识点以及每个所述交互习题样本所关联的各个第二知识点;在各个所述交互习题样本所关联的各个第二知识点中,查找与每一所述未交互习题样本所关联的每个第一知识点一致的目标知识点;依据各个所述目标知识点,确定与每个所述目标知识点对应的各个交互习题样本为目标交互习题样本
。4.
根据权利要求1所述的方法,其特征在于,所述基于预先训练的习题作答评估模型,评估所述用户在每个所述未交互习题上作答的未交互习题作答情况,包括:将各个所述交互习题

所述交互习题作答情况以及未交互习题输入至预先训练的习题
作答评估模型,评估各个所述未交互习题对应的未交互习题作答情况
。5.
根据权利要求1所述的方法,其特征在于,所述确定每个所述未交互习题对应的习题特征,包括:确定每个所述未交互习题中包括的各个习题知识点,基于这些习题知识点,以确定该未交互习题对应的习题区分度;分析每个所述未交互习题中包括的各个习题知识点对应的知识点难度,以确定该未交互习题对应的习题难度;将每个所述习题区分度和习题难度进行集合,以得到每个未交互习题对应的习题特征
。6.
根据权利要求1所述的方法,其特征在于,所述依据每个所述习题特征,确定每个所述未交互习题与已交互习题之间的特征相似度,包括:调用预设的相似度算法;将每个所述未交互习题...

【专利技术属性】
技术研发人员:刘淇陈恩红姚方舟黄振亚侯旻童世炜
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1