一种数学变式训练题推送系统以及关联方法技术方案

技术编号:18256642 阅读:27 留言:0更新日期:2018-06-20 08:22
一种数学变式训练题关联方法,该关联方法包括:规范获得的数学试题,所述数学试题包括已经手工标注关联的和没有关联标注的数学试题;建立深度学习模型,根据已有的训练样本对所述深度学习模型进行训练,获得变式训练题数据库。本发明专利技术通过深度学习模型利用教师已经关联标注的数学试题进行训练建模,解决了变式训练中数学试题自动关联和推荐推送问题,极大提高了教学的效率,降低了相关教学成本。

A mathematical variant training problem push system and correlation method

A method of association of mathematical variant exercises, which includes: a mathematical test obtained by a standard, which includes a mathematical test that has been manually labeled and without associated annotations; a depth learning model is established to train the advanced learning model on the basis of the existing training samples, and a variant training is obtained. Exercise database. This invention uses the depth learning model to train and model the mathematics test questions which the teacher has already associated with. It solves the problem of automatic correlation and recommendation of mathematics test questions in the variant training, greatly improves the efficiency of teaching and reduces the related teaching cost.

【技术实现步骤摘要】
一种数学变式训练题推送系统以及关联方法
本专利技术属于智能教学
,特别涉及一种数学变式训练题推送系统以及关联方法。
技术介绍
“变式训练”指教师在数学教学中变换问题中的条件或结论,转换问题的内容和形式,配置实际应用的各种情境,从而使学生从不同的途径去思考问题、去解决问题。运用变式训练可以有效地培养学生的求异思维与创新意识,使学生不只停留于事物的表象,而能自觉从本质看问题,为学生学好数学、用好数学打下良好的基础。因此,变式训练是初高中数学学习的有效方法。在变式训练中需要用到的数学试题的变式训练题,是根据现有的数学试题考察的知识点和解题思路而衍生出来的相似的数学试题。如果根据课程中的例题、中考、高考的典型题以及学生自己的错题来提供变式训练题,训练题的需求数量比较大。由于目前,变式训练题的生成方式主要是靠教师手工进行变式训练题的关联工作产生,任务繁重,效率很低,时间精力成本很高。随着信息技术的发展以及人工智能技术的不断成熟,自然语言处理(NLP,naturallanguageprocessing)得到了广泛的应用,同时相关的理论、技术也得到了很大的发展,使得将其用于数学试题的变式训练题的自动关联处理成为可能。然而目前绝大多数的自然语言处理的研究都集中于新闻、论坛、博客等领域,涉及科学专业领域的研究较少,涉及到符号、数学公式等处理的就更少。这是由于数学领域的文本不仅仅包含自然语言,还包含符号、数学公式等内容,而且其中所包含的自然语言也与平时用于日常交流的语言有一定的差别。现有的文献鲜见披露这方面的研究,也说明这种技术应用是极其困难的。
技术实现思路
本专利技术的实施例提供了一种自动进行数学变式试题关联的方法和系统,目的在于解决现有的变式训练中只能依靠教师手工关联数学试题导致的效率极低的问题。本专利技术的实施例之一,数学变式训练试题关联系统主要分为数学试题样本预处理和深度学习模型构建调优这两个模块。由于采用神经网络的深度学习模型需要大量高质量的数据,而试题试卷来源不一,预处理是必须的一步。预处理模块首先抽取试题里面的html标签,然后从html标签中抽取出数学公式,然后对数学公式进行规范化,最后对非公式文本进行规范化。重点主要在于数学公式的规范化和非公式文本的规范化。第二个模块是模型构建调优。模型构建与调优模块主要包括分词,训练词向量,数据增强,还有加入数学实体特征,以及训练与参数调优的功能。本专利技术的实施例之一,是一种数学变式训练题推送系统,所述推送系统是线上系统,用户通过网络将数学试题提交给线上推送系统。推送系统接收用户提交的数学试题,对所述的用户提交的数学试题进行规范化,然后将用户提交的所述数学试题与推送系统中的数学试题库中的试题进行关联判断,根据关联判断结果推送具有关联性的数学试题,该具有关联性的数学试题即为用于变式训练用的变式训练题。本专利技术通过深度学习模型利用教师已经关联标注的数学试题进行训练建模,解决了变式训练中数学试题自动关联和推荐推送问题,极大提高了教学的效率,降低了相关教学成本。尤其对于初等数学领域的试题关联,本专利技术可以有效地对数学试题进行规范化和快速判断两道题目是否可以进行关联。附图说明通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:图1本专利技术实施例中数学试题关联模型建立流程图。图2是本专利技术实施例中深度学习模型框架图。具体实施方式在机器学习和认知科学领域,人工神经网络是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对复杂函数进行估计或近似。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具。深度学习是机器学习的分支,是一种试图使用神经网络对数据进行高层抽象的算法。本专利技术在实施过程中也会借鉴已有的深度学习模型算法。本专利技术实施例之一,一种数学变式训练题关联方法,该关联方法包括:步骤S1,规范获得的数学试题,所述数学试题包括已经手工标注关联的和没有关联标注的数学试题;步骤S2,建立深度学习模型,根据已有的训练样本对所述深度学习模型进行训练,获得变式训练题数据库。其中,所述步骤S1具体包括以下步骤:S11,对数学公式文本规范化;S12,对非数学公式文本规范化。所述步骤S2具体包括以下步骤:步骤S21,数据准备,即,将教师已经手工关联标注的数学试题进行收集和规范;步骤S22,分词,即,将每一道数学试题分为若干个词,这个步骤包括让分词器根据数学实体表准确地识别出数学实体。步骤S23,对未进行过手工关联标注的数学试题进行预训练词向量。步骤S24,对于已经获得的训练样本数据采用包括替换的方法进行扩充增强。步骤S25,将是否具有相同的数学实体判断特征,作为判断两道题目是否可以进行关联的判断依据之一。步骤S26,构建和训练深度学习模型,所述深度学习模型包括词嵌入层、多层双向LSTM层和全连接层。如图1所示,该实施例从输入试题开始,首先抽取试题里面的html标签,然后从html标签中抽取出数学公式,然后对数学公式进行规范化,最后对非公式文本进行规范化。接着进行包括分词、训练词向量、数据增强,还有加入数学实体特征,以及建立神经网络模型,对模型进行训练与参数调优,最后输出关联标签。本专利技术的实施例之一,针对初等数学领域的试题关联方法,可以有效地对数学试题进行规范化和判断两道题目是否可以进行关联。具体的技术方案包括一种面向数学试题的关联方法,包括如下步骤:S1:数学试题的规范化;S2:深度学习模型建立。在基础框架方面,本专利技术采用大规模数学处理框架和基于深度学习的特征学习方法,利用大规模未标注和部分已标注的数据进行模型构建,从而预测试题是否可以进行关联。作为优化方案,所述S1具体包括以下步骤:步骤S11:公式的规范化。对于包括符合LaTex的计算机字符化的数学公式,例如$x$,\[x\],\(x\)都表示x,本专利技术首先要将头尾的包裹字符给去掉。LaTeX是当今世界上最流行和使用最为广泛的TeX格式,对于生成复杂的数学公式,LaTeX表现的更为出色。本专利技术可以处理符合LaTeX的数学公式,或者接近符合以及不符合LaTeX的数学公式。由于存在许多字符表达同样的数学语义,比如‘\geqslant’,‘\geq’,‘≥’,'≥'等字符都表达了大于等于这个语义,有必要将这些字符进行规范化。在符号规范化上,本专利技术选取了mathtype中的符号所对应的字符串,比如'≥'在mathtype中的字符串表示为’\ge’。例如,在表1中例举了本专利技术对于数学符号规范化处理。表1同时由于数学公式输入的不可能非常规范,题目中会存在一些字符不具备任何数学语义,去除这些字符后不影响题目的理解。例如,下面是一些无数学语义但常见的字符的数学字符。包括:\left,\right,\rm,\mathop,\hfill,ext等。对于这些无数学语义的处理,表2给出了范例。表2对于公式中出现的空白字符比如,\n等,本专利技术都替换成空格,并将若干个空格合并为一个空格。步骤S12:非公式本文档来自技高网...
一种数学变式训练题推送系统以及关联方法

【技术保护点】
1.一种数学变式训练题推送系统,其特征在于,所述推送系统接收用户提交的数学试题,将用户提交的所述数学试题与推送系统中的数学试题库中的试题进行关联判断,根据关联判断结果推送具有关联性的数学试题,该具有关联性的数学试题即为用于变式训练用的变式训练题。

【技术特征摘要】
1.一种数学变式训练题推送系统,其特征在于,所述推送系统接收用户提交的数学试题,将用户提交的所述数学试题与推送系统中的数学试题库中的试题进行关联判断,根据关联判断结果推送具有关联性的数学试题,该具有关联性的数学试题即为用于变式训练用的变式训练题。2.如权利要求1所述的数学变式训练题推送系统,其特征在于,所述推送系统是线上系统,用户通过网络将数学试题提交给线上推送系统。3.如权利要求1所述的数学变式训练题推送系统,其特征在于,在所述推送系统接收用户提交的数学试题后,对所述的用户提交的数学试题进行规范化。4.一种数学变式训练题关联方法,其特征在于,该关联方法包括:步骤S1,规范获得的数学试题,所述数学试题包括已经手工标注关联的和没有关联标注的数学试题;步骤S2,建立深度学习模型,根据已有的训练样本对所述深度学习模型进行训练,获得变式训练题数据库。5.如权利要求4所述的数学变式训练题关联方法,其特征在于,所述步骤S1具体包括以下步骤:S11,对数学公式文本规范化;S12,对非数学公式文本规范化。6.如权利要求4所述的数...

【专利技术属性】
技术研发人员:谢德刚岳翔
申请(专利权)人:上海互教教育科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1