【技术实现步骤摘要】
基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法
本专利技术涉及数学能力缺陷点检测
,具体涉及基于机器学习的中小学数学能力点缺陷极小样本高精度检测方法。
技术介绍
数学学科在中小学生学习中占有非常重要的基础性地位,甚至可以说直接决定了一名学生的综合学习能力和考试成绩的高低,因而受到学校、老师、家长和学生的广泛重视。另一方面,数学也是学生普遍反映较难的科目,知识点较为抽象和多变,相同知识点有很多种呈现形式和难度值,教师和学生均不易加以变通、总结和归纳。导致虽然从小学一年级到高中三年级(以下简称K12阶段),绝大多数学生在数学学科耗费了大量的时间与精力,反复进行大量练习甚至课外补习,收效却不明显。因为无法抓住真正薄弱的知识点(后文称为缺陷点)进行个性化的重点突破,只能是万人一面做大量重复学习,不仅浪费时间,还挫伤了学习积极性与信心。所以准确捕捉学生在数学学科学习中的知识缺陷点不仅可以有效提升学习效率、成绩,而且是个性化学习和兴趣导向学习的基础。传统学习情境下,有针对性的查漏补缺只能存在于非常有经验的教师组织的小班或1对1(1v1)教学场景,成本高昂,而且由于名师远远供不应求,只能牺牲教育的公平性和普惠性来满足少数城市和富裕家庭的需求,对于数学这一关乎未来国民整体科技素养的基础学科而言,与我国义务教育的宗旨背道而驰。随着近二十年来人工智能特别是其中机器学习算法的爆发式发展,从技术角度首次具备了全民“因材施教”、“千人千面”和兴趣驱动学习的可能性。蓬勃发展的在线教学和电子化学习、考试开始让学习数 ...
【技术保护点】
1.基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法,其特征在于,包括如下步骤:/n步骤1:构建K12阶段的数学能力图谱,并构建能力点之间的概率联系;/n步骤2:生成题库,并打上能力点标签数据;/n步骤3:使用RNN+SortNet的方法来对学生的答题数据以及步骤1得到的数学能力图谱数据进行模型训练,得到学生动态的能力缺陷点排名预测,将当前能力点按掌握程度从低到高排序,从而发现学生在数学学科学习中的能力缺陷点。/n
【技术特征摘要】
1.基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法,其特征在于,包括如下步骤:
步骤1:构建K12阶段的数学能力图谱,并构建能力点之间的概率联系;
步骤2:生成题库,并打上能力点标签数据;
步骤3:使用RNN+SortNet的方法来对学生的答题数据以及步骤1得到的数学能力图谱数据进行模型训练,得到学生动态的能力缺陷点排名预测,将当前能力点按掌握程度从低到高排序,从而发现学生在数学学科学习中的能力缺陷点。
2.如权利要求1所述的基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法,其特征在于,所述步骤1中的构建K12阶段的数学能力图谱,具体步骤是:
步骤1.1:通过解析K12阶段的最细粒度的数学能力,获得K12阶段的数学能力图谱,包括若干个能力点;
步骤1.2:能力点之间的概率联系构建:给定标注好能力点的题库Q={q1,q2,...,qn},使用随机游走方法迭代获得最佳网络概率联接参数。
3.如权利要求2所述的基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法,其特征在于,所述步骤1.2中的能力点之间的概率联系构建,具体步骤包括:标注好的知识点与题目构成了二分图,即知识点构成了一组节点集合,题目构成了另一组节点集合,有且只有知识点节点和题目节点之间有连接的边,借鉴蚁群信息素+随机游走的方法,采用一种计算二分图节点相似性的方法,来计算原本没有联系的知识点间的概率关联;
节点ui代表知识点,vj代表题目,如果题目vj被标注为与ui知识点相关,则ui与vj有边相连;
为第t轮迭代,知识点ui带有的信息素种类及浓度;为第t轮迭代,题目vj带有的信息素种类及浓度;
初始化阶段,和均为长度为|U|的矢量,|U|即知识点数;
通过题目与知识点之间关联的多次传播和迭代,可以得到每个知识点节点上携带的所有其他知识点信息素种类和数量,代表了该知识点与其他知识点的联系及强弱,从而构成一幅带有转移概率联接的知识图谱。
4.如权利要求1所述的基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法,其特征在于,所述步骤2中的生成题库,并打上能力点标签数据,具体步骤包括:
步骤2.1:生成题库:根据互联网上公开的各年度的各年级数学考试真题以及部分用作机器学习的K12题库,经过扫描和数字化之后,获得12个学年段的题库;
步骤2.2:对题库中的题全部打上能力点标签数据。
5.如权利要求1所述的基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法,其特征在于,所述步骤3的发现过程,具体步骤如下:
步骤3.1:数据准备和预处理,包括能力点激活预处理和训练和测试数据准备;
步骤3.2:模型训练,具体包括:
训练过程,预测过程
其中Q为问题相关的特征集合,qi=[t1,t2,...,tm,qscorei,yi]是模型的输入数据,T为知识点相关的特征集合,tj为表征该题是否涉及知识点j,取值0代表不涉及,1代表涉及,qscorei代表题目的难度值,取值范围(0,1),越大代表题目越难,yi是学生回答的结果,正确为1,错误为0;是用户最近测评的结果,其中ui为最近几次评测的按主题缺陷度排序结果;是预测结果,包含m个待排序主题的向量,其中按掌握程度从低到高排序为:r1<r2<…<rm,是用于训练排序,包含m个待排序主题的向量,其中按掌握程度从低到高排序为:s1=s2=…=sk<sk+1=sk+2=…=sm,被标记为缺陷的k个知识点整体低于其余知识点;对于SortNet网络,正向传播公式为:
N>(<x,y>)=σ(∑i,i′wi,>hi(<x,y>)+wi′,>hi′(<x,y>)+b>),(6)
对于RNN网络,正向传播公式为:
ht=tanh(Whxxt+Whx′x′t+Whhht-1+bh),(7)
yt=σ(Wyhht+by),(8)
SortNet网络接收自变量输入数据,产生结果N>和N<,分别代表输入知识点k(x参数)缺陷值大于和小于知识点p(y参数)的概率,进而又作为RNN网络的输入参数,RNN进行3个周期的序列计算,输出o;o接近1代表k知识点的缺陷度大于知识点p,o接近-1代表k知识点的缺陷度小于知识点p;vxk,i和vyk,i为SortNet层待学习的联接权重,Whx和Whx′为RNN层待学习的联接权重,分别对应输入的N>和N<,Whh为待学习的隐含层...
【专利技术属性】
技术研发人员:吴湖,
申请(专利权)人:武汉青忆辰科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。