System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于对比学习的中学几何问题自动求解方法技术_技高网

一种基于对比学习的中学几何问题自动求解方法技术

技术编号:40559031 阅读:13 留言:0更新日期:2024-03-05 19:20
本发明专利技术公开了一种基于对比学习的中学几何问题自动求解方法,其方法为:收集若干道中学几何题及答案得到所需的中学几何数据集;划分成无图几何题数据集和有图几何题数据集;无图几何题输入到几何图像生成器中获得准确率高的几何图形;再输入到有图解题器中得到最终的多模态特征向量;有图解题器中的程序解码器得到准确率高的解题答案;最后将几何图像生成器和有图解题器合在一起测试,形成一个解决自己作图和自带图形的几何题型的统一大模型。本发明专利技术的有益效果是:从全新的视角,将中学几何问题分成两种题型来分别对应解决,并将它们融合到一起形成一个能解中学几何问题的模型。

【技术实现步骤摘要】

本专利技术涉及机器学习系统领域,具体为一种基于对比学习的中学几何问题自动求解方法


技术介绍

1、近年来,研究者们开发的机器学习系统自动解决数学应用题(mwp),由于其较高的学术价值和在智慧教育中的巨大应用潜力而日益受到关注。现有的方法大多集中于解决算术和代数问题,包括传统的机器学习方法和基于网络的模型,而解决几何问题一直鲜有研究。几何作为一个经典的数学问题,其在中学教育中占据了很大一部分。由于几何问题的挑战性和数据特性,它也可以作为一个多模态的数值推理基准,需要在图解和文本上进行联合推理。

2、通常来说,一道典型的几何题型主要由文字和几何图形组成。与数学应用题只涉及问题文本相比,几何题型提出了以下新的挑战。首先,附加的问题图提供了问题文本中缺少的基本信息,如线和点的相对位置;因此,求解器应该具有解析关系图的能力。其次,要解决一个几何问题,我们需要同时理解和对齐文本和图表的语义。然而,问题文本往往包含一些对图元的歧义引用和隐含关系,这增加了文本与图元联合推理的难度。第三,许多几何问题在解题过程中需要额外的定理知识。尽管以往有一些方法试图解决上述问题,但其几何问题求解系统的性能远不能令人满意。它们高度依赖于有限的手工规则,并且只在小规模的数据集上验证,这使得它很难推广到更复杂和真实世界的情况。此外,求解过程复杂,这意味着人类很难理解和检验它的可靠性。

3、最近,许多工作为各种视觉语言推理和生成任务提出了统一的模型,因为底层的视觉/语言理解和推理能力在很大程度上是共同的。受主流进展的启发,我们认为统一的几何问题求解模型也是必要的。首先,几何题型分为自带几何图形的题型,俗称有图几何题;和原文没有图形而需要自己作图来辅助解题的题型,俗称无图几何题。几何题中无论什么题型,在解题过程中都共享几何推理中的一些基本技能和知识。因此,探索统一神经网络在数学领域的一般理解和推理能力是一个很有意义的课题。此外,统一模型不需要辅助模型来确定问题是有图几何题还是无图几何题。这大大提高了解题的效率,并且还减少了因分类题型而出现的错误,从而使得模型能更好的完成解题任务。为此,建立一个在数据层和模型层统一处理几何问题的框架是有价值的,也是值得期待的。


技术实现思路

1、为了解决上述技术问题,本专利技术提出了一种基于对比学习的中学几何问题自动求解方法,从题型视角出发,将几何题型分为两种:有图几何题和无图几何题,针对以上两种题型分别提出了对应的解决方案,最终形成了一个能解决这两类题型的中学几何数学统一大模型。

2、本专利技术采用的技术方案如下:一种基于对比学习的中学几何问题自动求解方法,其方法步骤如下:

3、步骤s1,数据集构建:收集若干道中学几何题及答案;并分别按照训练集、验证集、测试集对收集若干道几何题及答案进行划分,得到所需的中学几何数据集;

4、步骤s2,任务形式化定义:给定包含n条中学几何数据集,经过题型分类器划分成:无图中学几何题数据集b和有图中学几何题数据集c;

5、步骤s3,无图中学几何题数据集b中有y道需要自己作图的几何题型by和有图中学几何题数据集c中z道自带图形的几何题型cz输入到中学几何问题自动求解模型中的bert特征编码器中;获取中学几何题题干中的所有字嵌入特征向量;

6、步骤s4,将bert特征编码器获得的无图中学几何题题干中的字嵌入特征向量输入到几何图像生成器中,几何图像生成器基于对比学习模型训练与微调得到,用于生成中学几何题所需要的几何图形,采用人工监督的方式进行对比学习模型训练,通过均方误差损失函数计算几何图形生成损失lprior,优化更新bert特征编码器和几何图像生成器的参数,获得几何图形;

7、步骤s5,将bert特征编码器获得的有图中学几何题题干中的字嵌入特征向量以及无图中学几何题和几何图像生成器所生成对应的几何图形输入到有图解题器中,然后有图解题器中内含的图形编码器将几何图形进行编码并特征提取,与bert特征编码器的字嵌入特征向量进行中学几何题干与几何图形的对齐操作得到最终的多模态特征向量;

8、步骤s6,有图解题器中的程序解码器在多模态特征向量的引导下顺序生成解题程序,采用负对数似然损失函数计算解题错误的生成损失lg,得到准确率高的解题答案;

9、步骤s7,将几何图像生成器和有图解题器合在一起测试,形成一个既能解决需要自己作图的无图几何题型,也能解决自带图形的几何题型的统一大模型。

10、进一步的,步骤s1中数据集构建,收集若干道中学几何题型及答案,执行以下任务;具体为:

11、步骤s11,去除重复的中学几何题型及答案;

12、步骤s12,将中学几何题型及答案分类成两种几何题型,有图形的自动分类为有图中学几何题,只有题干而没有几何图形的分类为无图中学几何题;

13、步骤s13,对中学几何题型进行分类检验,即对同一中学几何题型分类结果采用人工检查和校验;

14、步骤s14,经过人工检查和校验后,按照训练集:验证集:测试集的比例=8:1:1对中学几何题型及答案进行划分;

15、步骤s15,中学几何题型及答案进行划分后,将训练集以及验证集的中学几何题型进行人工的解题标注;根据答案将解题步骤提炼出来,采用人工方式将解题步骤标注成计算机能识别的程序语言。

16、进一步的,步骤s3中的bert特征编码器,使用transformer模型架构中的编码器模块,由多层双向编码器组成,计算过程如公式(1)所示;

17、                        (1);

18、其中,eiw为第i个字令牌wi经过bert特征编码器得到的相应字嵌入特征向量。

19、进一步的,步骤s4中的几何图像生成器,具体内容包括:

20、步骤s41,输入数据到几何图像生成器中,输入数据为无图中学几何题题干中的相应字嵌入特征向量;

21、步骤s42,几何图像生成器是改编的对比学习模型,对比学习模型是一个文本-图像对的分类模型,对对比学习模型进行训练和微调来达到生成几何图像的下游任务;

22、步骤s43,对对比学习模型进行训练:

23、收集并整理有图几何题数据集,得到中学几何题干和对应的几何图形;

24、分别对中学几何题干和对应的几何图形进行特征提取得到字嵌入特征向量eiw和几何图形特征hcnn,形成文本-图像对;

25、将文本-图像对的特征输入到文本-图像对的分类模型中去做对比学习,在人工监督的情况下将其中互相匹配的文本-图像对标记为正样本,不匹配的文本-图像对标记为负样本;

26、文本-图像对的分类模型能通过正样本、负样本得到中学几何题干和对应的几何图形,即给出一个字嵌入特征向量eiw找出对应的几何图形特征hcnn;

27、步骤s44,对对比学习模型进行微调:

28、定义文本为x,几何图形为y,产生的图形本文档来自技高网...

【技术保护点】

1.一种基于对比学习的中学几何问题自动求解方法,其特征在于:方法步骤如下:

2.根据权利要求1所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S1中数据集构建,收集若干道中学几何题型及答案,执行以下任务;具体为:

3.根据权利要求2所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S3中的BERT特征编码器,使用Transformer模型架构中的编码器模块,由多层双向编码器组成,计算过程如公式(1)所示;

4.根据权利要求3所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S4中的几何图像生成器,具体内容包括:

5.根据权利要求4所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S5中有图解题器,包含双向LSTM层、图形编码器、联合推理模块以及程序解码器四大模块;具体内容包括:

6.根据权利要求4所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S6中生成损失Lg采用目标程序的负对数似然,其计算公式如(7)所示;

7.根据权利要求6所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:中学几何问题自动求解模型,分为BERT特征编码器、几何图像生成器、有图解题器和统一大模型四大模块,BERT特征编码器分别串行几何图像生成器与有图解题器,几何图像生成器与有图解题器呈并行结构,之后串行统一大模型。

...

【技术特征摘要】

1.一种基于对比学习的中学几何问题自动求解方法,其特征在于:方法步骤如下:

2.根据权利要求1所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤s1中数据集构建,收集若干道中学几何题型及答案,执行以下任务;具体为:

3.根据权利要求2所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤s3中的bert特征编码器,使用transformer模型架构中的编码器模块,由多层双向编码器组成,计算过程如公式(1)所示;

4.根据权利要求3所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤s4中的几何图像生成器,具体内容包括:

5.根据权利要求4所...

【专利技术属性】
技术研发人员:罗文兵吴督邦黄琪王明文罗凯威陈奥刘祥棋
申请(专利权)人:江西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1