【技术实现步骤摘要】
基于学习者画像与习题相似度的预科中文习题推送方法
[0001]本专利技术涉及推荐算法
,具体涉及一种基于学习者画像与习题相似度的预科中文习题推送方法。
技术介绍
[0002]随着2020年席卷全球的新冠疫情的发生,线上教育因其独特优势,在疫情前期呈现出了井喷式的发展,也使更多人意识到了线上教育这一领域的价值与发展前景。随着后疫情时代的来临,我国国内的防控防疫形式趋于稳定,防疫重心逐渐转向外来输入病例。这在为创造国内安全稳定的社会环境的同时,也导致了境外生来华的诸多不便,因此各院校也顺势推出针对境外生的在线学习平台。其中,预科中文学习是这些在线学习平台的重要组成部分,能为参加教育部推出的本科来华留学生预科教育结业考试的留学生提供在线智能学习辅导,帮助学生顺利通过考试并且获得高分。平台涵盖汉语水平测试,真题练习,模拟考试等实用功能。
[0003]目前,用户在传统预科中文学习平台上获取习题,往往只能停留在按知识点、按错题本或纯随机出题,其本质是被动的、非个性化的推送机制,系统不能根据多维度的信息为学习者推送习题,因此 ...
【技术保护点】
【技术特征摘要】
1.一种基于学习者画像与习题相似度的预科中文习题推送方法,其特征在于,包括:步骤10、基于用户的母语语系与用户的历史做题轨迹构建学习者画像;步骤20、构建知识点多叉树,然后采用LCA机制计算习题的相似度;步骤30、基于用户的学习者画像与习题相似度,生成候选习题队列;步骤40、基于用户交互数据遍历候选习题队列,生成推送习题队列。2.根据权利要求1所述的方法,其特征在于:所述步骤10具体包括:步骤11、将用户的母语信息L映射到九大语系与孤立语系LF,LF∈(0,1,2,3,4,5,6,7,8,9);步骤12、获取用户的历史做题轨迹数据集H,构建用户习题轨迹向量X,其中,X的长度为预科留学生中文知识大纲一级知识点的规模,X的值为一级知识点的做题准确率;步骤13:汇总用户的母语信息L、语系数据LF以及用户习题轨迹向量X形成学习者画像UP=(L,LF,X);步骤14:对于任意两位用户a和用户b,学习者画像分别为Ua(L1,LF1,X1)与Ub(L2,LF2,X2),采用如下公式计算用户a和用户b学习者画像的相似度:其中,n为预科留学生中文知识大纲一级知识点的规模,X
1i
为用户a在预科留学生中文知识大纲第i个一级知识点下的做题准确率,X
2i
为用户b在预科留学生中文知识大纲第i个一级知识点下的做题准确率。3.根据权利要求1所述的方法,其特征在于:所述步骤S20具体包括:步骤21、根据预科中文知识大纲构造知识点多叉树T,所述知识点多叉树T的根节点R为一虚拟节点,深度h为0,深度h为1的节点与中文知识大纲的一级知识点对应设置,下层子节点与中文知识大纲的下层知识点对应设置;定义所述知识点多叉树T路径权值函数为:d(h)=0.5
h
步骤22、针对任意两道习题e
i
,e
j
(i≠j;i,j=1,2...q,q为题库EL的习题数量),根据两道习题分别对应的知识点组K
ei
={k
ei1
,k
ei2
,...,k
ein
}与K
ej
={k
ej1
,k
ej2
,...,k
ejm
},计算K
ei
与K
ej
产生的所有知识点对的LCA节点,所述LCA节点为:对于有根树T的两个结点u、v,最近公共祖先LCA节点表示一个结点x,满足x是u和v的祖先且x的深度尽可能大;计算出所有知识点对的LCA节点到根节点的边权值的均值,得到习题e
i
和e
j
的习题相似度,公式如下:
其中,k
LCA(keio,kejp)
为k
eio
与k
ejp
对应知识点的LCA节点,Dist(k)为任意节点至根节点路径权值和,L
ei
为题目e<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。