当前位置: 首页 > 专利查询>广州大学专利>正文

一种动态几何图形的自动生成方法及装置制造方法及图纸

技术编号:38657981 阅读:11 留言:0更新日期:2023-09-02 22:43
本公开提供了一种动态几何图形的自动生成方法及装置,其中,方法包括:对平面几何题目进行数据清洗得到规范化数据集,补全规范化数据集中的原子关系得到完整关系数据集;使用通过训练语料训练好的几何实体识别模型,对完整关系数据集进行几何实体抽取得到几何实体列表,挖掘隐藏几何实体,将隐藏几何实体加入到几何实体列表,并消除几何实体列表中的重复几何实体;逐句匹配完整关系数据集中的关系词得到关系列表,将几何实体列表中的几何实体与关系列表中的关系词顺序拼接得到关系三元组;将关系三元组映射至网络画板内,根据关系三元组设置作图指令自动生成几何图形。设置作图指令自动生成几何图形。设置作图指令自动生成几何图形。

【技术实现步骤摘要】
一种动态几何图形的自动生成方法及装置


[0001]本文件涉及自然语言处理
,尤其涉及一种动态几何图形的自动生成方法及装置。

技术介绍

[0002]自然语言处理是计算机科学领域与人工智能领域中的重要研究方向,能够实现人与计算机之间的有效通信,在数学教育领域中能够通过自然语言处理技术实现类人解题,即通过机器处理输入的自然语言题目并进行逻辑推理,自动得到解答结果,研究类人解题能够为教育发展带来创新性的进步。
[0003]目前相关技术中,已经出现了一些能够处理简单数学题的工具,甚至能够对小学奥数题做出正确的解答,但这些工具在处理平面几何问题上仍存在不足,甚至无法理解基础的平面几何题目。
[0004]综合以上该
发展状况分析,现有的技术中亟需一种能够理解平面几何题目,并自动生成相应几何图形的方法。

技术实现思路

[0005]本专利技术的目的在于提供一种动态几何图形的自动生成方法及装置,旨在解决现有技术中的上述问题。
[0006]根据本公开实施例的第一方面,提供一种动态几何图形的自动生成方法,包括:
[0007]对平面几何题目进行数据清洗得到规范化数据集,补全规范化数据集中的原子关系得到完整关系数据集;
[0008]使用通过训练语料训练好的几何实体识别模型,对完整关系数据集进行几何实体抽取得到几何实体列表,挖掘隐藏几何实体,将隐藏几何实体加入到几何实体列表,并消除几何实体列表中的重复几何实体;
[0009]逐句匹配完整关系数据集中的关系词得到关系列表,将几何实体列表中的几何实体与关系列表中的关系词顺序拼接得到关系三元组;
[0010]将关系三元组映射至网络画板内,根据关系三元组设置作图指令自动生成几何图形。
[0011]根据本公开实施例的第二方面,提供一种动态几何图形的自动生成装置,包括:
[0012]数据预处理模块,用于对平面几何题目进行数据清洗得到规范化数据集,补全规范化数据集中的原子关系得到完整关系数据集;
[0013]几何实体识别模块,用于使用通过训练语料训练好的几何实体识别模型,对完整关系数据集进行几何实体抽取得到几何实体列表,挖掘隐藏几何实体,将隐藏几何实体加入到几何实体列表,并消除几何实体列表中的重复几何实体;
[0014]关系三元组生成模块,用于逐句匹配完整关系数据集中的关系词得到关系列表,将几何实体列表中的几何实体与关系列表中的关系词顺序拼接得到关系三元组;
[0015]图形自动生成模块,用于将关系三元组映射至网络画板内,根据关系三元组设置作图指令自动生成几何图形。
[0016]本公开的实施例提供的技术方案可以包括以下有益效果:使用处理后的题目数据集得到作图所需的关系三元组,提升了实体提取及关系提取的准确性,通过平面几何的自然语言描述,在数学领域软件中能够自动生成对应的动态几何图形。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0018]为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是本专利技术实施例的动态几何图形的自动生成方法的流程图;
[0020]图2是本专利技术实施例的训练语料标注的示意图;
[0021]图3是本专利技术实施例的关系三元组知识图谱的示意图;
[0022]图4是本专利技术实施例的自动生成几何图形的示意图;
[0023]图5是本专利技术实施例的动态几何图形生成完整步骤的示意图;
[0024]图6是本专利技术实施例的动态几何图形的自动生成装置的示意图。
具体实施方式
[0025]为了使本
的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
[0026]方法实施例
[0027]根据本专利技术实施例,提供了一种动态几何图形的自动生成方法,图1是本专利技术实施例的动态几何图形的自动生成方法的流程图,如图1所示,根据本专利技术实施例的动态几何图形的自动生成方法具体包括:
[0028]在步骤S110中,对平面几何题目进行数据清洗得到规范化数据集,补全规范化数据集中的原子关系得到完整关系数据集。具体包括:
[0029]对采用python爬虫获得的平面几何题目进行数据清洗,平面几何题目选自中学平面几何证明题或中学数学平面几何计算题,依据数据统计与分析,结合基础平面几何关系语法规则,将“//”、等计算机无法直接处理的符号进行规范化,并识别平面几何题目中的错别字进行纠正。
[0030]使用多层递归方法依次剥离规范化数据集中的原子关系,并依据原子关系自动补全规范化数据集,例如“四边形ABCD、EFGH都是正方形”,此处存在原子关系“四边形ABCD”和“四边形EFGH”,根据递归理解题目规范化为“正方形ABCD,正方形EFGH”。
[0031]在步骤S120中,使用通过训练语料训练好的几何实体识别模型,对完整关系数据集进行几何实体抽取得到几何实体列表,挖掘隐藏几何实体,将隐藏几何实体加入到几何实体列表,并消除几何实体列表中的重复几何实体。
[0032]步骤S120中几何实体识别模型为提前训练并测试好的可用模型,即通过模式匹配法标注训练集的几何实体得到训练语料,使用训练语料对BiLSTM_CRF_NER模型进行训练,得到训练好的几何实体识别模型。具体包括:对用于训练的几何题目中的几何实体制作标注并保存为ann格式,将ann格式与原始txt格式几何题目文件组成语料,将语料按7:3划分为训练语料和测试语料进行训练和测试,得到几何实体识别模型。其中,语料同样经过规范化和原子关系处理,标注的标签包括:O、Point、Line、Angle、Triangle、Polygon、Value、Area、Perimeter、Shape_Limit、Line_Group、Angle_Group、Value_Group、Area_Group及Perimeter_Group,含Group表示提取出来的是实体组合,例如提取出实体"AB+BC",其整体标注则为“Line_Group”。图2是本专利技术实施例的训练语料标注的示意图,如图2所示,展示了制作标注的方式。
[0033]通过模式匹配法挖掘几何实体包含的其它所有类型的几何实体即隐藏几何实体,并从形式不一致但含义一致的多个几何实体消除几何实体列表中的重复几何实体。如三角形ABC本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种动态几何图形的自动生成方法,其特征在于,包括:对平面几何题目进行数据清洗得到规范化数据集,补全所述规范化数据集中的原子关系得到完整关系数据集;使用通过训练语料训练好的几何实体识别模型,对所述完整关系数据集进行几何实体抽取得到几何实体列表,挖掘隐藏几何实体,将所述隐藏几何实体加入到所述几何实体列表,并消除所述几何实体列表中的重复几何实体;逐句匹配所述完整关系数据集中的关系词得到关系列表,将所述几何实体列表中的几何实体与所述关系列表中的关系词顺序拼接得到关系三元组;将所述关系三元组映射至网络画板内,根据所述关系三元组设置作图指令自动生成几何图形。2.根据权利要求1所述的方法,其特征在于,所述补全所述规范化数据集中的原子关系得到完整关系数据集具体包括:使用多层递归方法依次剥离所述规范化数据集中的原子关系,并依据原子关系自动补全所述规范化数据集。3.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:通过模式匹配法标注训练集的几何实体得到训练语料,使用所述训练语料对BiLSTM_CRF_NER模型进行训练,得到训练好的几何实体识别模型。4.根据权利要求1所述的方法,其特征在于,所述挖掘隐藏几何实体加入到所述几何实体列表,并消除所述几何实体列表中的重复几何实体具体包括:通过模式匹配法挖掘所述几何实体包含的其它所有类型的几何实体即隐藏几何实体,并从形式不一致但含义一致的多个几何实体消除所述几何实体列表中的重复几何实体。5.根据权利要求1所述的方法,其特征在于,所述逐句匹配所述完整关系数据集中的关系词得到关系列表,将所述几何实体列表中的几何实体与所述关系列表中的关系词顺序拼接得到关系三元组具体包括:通过模式匹配法为所述完整关系数据集中每个分句匹配一个从现有的几何关系种类中选取的关系词,按照所述几何实体列表和所述关系列表中的顺序,将对应顺序的所述几何实体与所述关系词拼接得到关系三元组。6.根据权利要求1所述的方法,其特征在于,所述根据所述关系三元组设置作图指令自动生成几何图形具体包括:设置创建表示点的Point点对象的作图指令,基于所述Point点对象设置创建表示边的Line线对象的作图指令,直接或间接设置所有实体属性的作图指令,其中,所述实体属性包含Point点对象和Line线对象的属性;将所述设置实体属性...

【专利技术属性】
技术研发人员:饶永生丁千惠徐瑞禧许中兰申选贤周蔚管皓
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1