数学主观题解答结果的结构分析方法及系统技术方案

技术编号:18007026 阅读:44 留言:0更新日期:2018-05-21 07:39
本发明专利技术公开了一种数学主观题解答结果的结构分析方法及系统,该方法包括:首先对待阅答题信息进行分词处理,然后根据分词处理结果对所述待阅答题信息进行结构分析,通过该步骤可以获取待阅答题的答题信息间关系,由于答题步骤和步骤间关系可以表征答题者的答题逻辑,这样可以将答题者的答题逻辑和参考答案的答题逻辑进行比对,以便于根据比对结果对答题逻辑进行评阅,能有效提升开放性题型的评阅结果的准确度。

【技术实现步骤摘要】
数学主观题解答结果的结构分析方法及系统
本专利技术涉及自然语言处理、深度学习领域,具体涉及一种数学主观题解答结果的结构分析方法及系统。
技术介绍
在传统教学过程中,老师作为考试和作业评阅的主体,长期承担着大量的工作量。评阅工作中包含了大量的重复信息,特别在数学解答题的评阅场景下,学生的作答结果往往对应固定的知识点,重复性更加明显。与此同时,随着互联网技术和产品逐渐向教育领域渗透,在线教育的受众的规模不断扩大,又进一步增加了考试和作业评阅的数量。另一方面,在处理大规模评阅工作时,老师容易受到疲劳、个人偏好等主观因素的干扰,从而影响评阅,尤其是评分的准确性和客观性。因此利用计算机完成或辅助完成评阅,以减少人工评阅的工作量,提升评阅,尤其是评分的准确性和客观性,对教学过程意义重大。
技术实现思路
本专利技术提供一种数学主观题解答结果的结构分析方法及系统,以解决现有的数学主观题解答结果的结构分析主要依赖人工进行结构分析,不能满足实际需要的问题。为此,本专利技术提供如下技术方案:一种数学主观题解答结果的结构分析方法,包括:接收待阅答题信息,并对所述待阅答题信息进行分词处理;基于分词处理结果和预先构建的分步模型,得到待阅答题信息的答题步骤;基于答题步骤向量、统计特征向量和预先训练的关系分析模型,得到步骤间关系,所述统计特征向量包括以下任意一种或多种:结构特征、引导词特征、步骤关联特征、关键词特征。优选地,所述步骤间关系包括以下任意一种:推导、并列和重复。优选地,所述分步模型为神经网络,包括:向量化模块、多层序列获取模块和分类模块,其中,向量化模块的输入为分词处理得到的词,向量化模块的输出为词向量序列,多层序列获取模块的输入为词向量序列,多层序列获取模块的输出为序列向量,分类模块的输入为序列向量,分类模块的输出为分词点作为分离步骤点的判断结果。优选地,所述关系分析模型为卷积神经网络;所述关系分析模型包括:输入层、卷积层、分类层和输出层,其中,输入层的输入为答题步骤向量,卷积层为多层,卷积层的输出为用于确定步骤间关系的分布式特征向量,分类层的输入为分布式特征向量和基于规则提取的统计特征向量,输出层的输出为步骤间关系的判断结果。优选地,在对所述待阅答题信息进行分词处理之前,所述方法还包括:对所述待阅答题信息进行数学实体识别;所述对所述待阅答题信息进行分词处理包括:基于所述数学实体识别结果对所述待阅答题信息进行分词处理。优选地,所述方法还包括:对正确答案进行结构分析,得到正确答案的答题步骤和步骤间关系;将所述待阅答题信息的答题步骤、步骤间关系与所述正确答案的答题步骤、步骤间关系进行比对,得到评阅结果。相应地,本专利技术还提供了一种数学主观题解答结果的结构分析系统,包括:答题信息接收模块,用于接收待阅答题信息;分词模块,用于对所述待阅答题信息进行分词处理;答题步骤获取模块,用于基于分词处理结果和预先构建的分步模型,得到待阅答题信息的答题步骤;步骤间关系获取模块,用于基于答题步骤向量、统计特征向量和预先训练的关系分析模型,得到步骤间关系,所述统计特征向量包括以下任意一种或多种:结构特征、引导词特征、步骤关联特征、关键词特征。优选地,所述分步模型为神经网络,包括:向量化模块、多层序列获取模块和分类模块,其中,向量化模块的输入为分词处理得到的词,向量化模块的输出为词向量序列,多层序列获取模块的输入为词向量序列,多层序列获取模块的输出为序列向量,分类模块的输入为序列向量,分类模块的输出为分词点作为分离步骤点的判断结果。优选地,所述关系分析模型为卷积神经网络;所述关系分析模型包括:输入层、卷积层、分类层和输出层,其中,输入层的输入为答题步骤向量,卷积层为多层,卷积层的输出为用于确定步骤间关系的分布式特征向量,分类层的输入为分布式特征向量和基于规则提取的统计特征向量,输出层的输出为步骤间关系的判断结果。优选地,所述系统还包括:实体识别模块,用于对所述待阅答题信息进行数学实体识别;所述分词模块具体用于基于所述数学实体识别结果对所述待阅答题信息进行分词处理。优选地,所述系统还用于获取正确答案的答题步骤和步骤间关系;所述系统还包括:评阅模块,用于将所述待阅答题信息的答题步骤、步骤间关系与所述正确答案的答题步骤、步骤间关系进行比对,得到评阅结果。本专利技术实施例提供的数学主观题解答结果的结构分析方法及系统,首先对待阅答题信息进行分词处理,然后根据分词处理结果对所述待阅答题信息进行结构分析,通过该步骤可以获取待阅答题的答题信息间关系,由于答题信息间关系可以表征答题者的答题逻辑,这样使得本专利技术可以获取解答结果的答题逻辑,以便于后续根据答题者的答题逻辑和参考答案的答题逻辑进行比对,评阅答题者的答题逻辑是否正确。进一步地,本专利技术提供了步骤间关系的种类,通过该种类可以简单清晰的表征答题步骤间关系,有助于提升开放性题型的评阅结果的准确度。进一步地,本专利技术提供了对待阅答题信息进行结构分析的具体方法:基于所述分布式特征向量和提取的统计特征向量获取步骤间关系,其中,分布式特征向量可以根据待阅答题信息的词向量获取,这样就可以通过待阅答题信息通过计算机自动获取答题信息间关系。进一步地,本专利技术提供了答题步骤分离的方法,利用该方法可以通过计算机自动获取各答题步骤。进一步地,本专利技术还提供了待阅答题信息的评阅方法,可以根据所述待阅答题信息的答题步骤、步骤间关系对待阅答题信息进行评阅。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的数学主观题解答结果的结构分析方法的第一种流程图;图2是本专利技术实施例提供的数学主观题解答结果的结构分析方法的第二种流程图;图3是本专利技术实施例提供的数学主观题解答结果的结构分析系统的第一种结构示意图;图4是本专利技术实施例提供的数学主观题解答结果的结构分析系统的第二种结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术实施例的方案,下面结合附图和实施方式对本专利技术实施例作进一步的详细说明。针对现有的数学主观题解答结果的结构分析主要依赖人工进行分析,本专利技术实施例提供的数学主观题解答结果的结构分析方法,可以自动提取待阅答题信息的答题信息间关系来表征答题者的答题思路和结构,这样便于后续对答题结果进行评阅。如图1所示,是本专利技术实施例提供的数学主观题解答结果的结构分析方法的第一种流程图。该数学主观题解答结果的结构分析方法可以包括以下步骤:步骤S01、接收待阅答题信息,并对所述待阅答题信息进行分词处理。其中,待阅答题信息可以为答题图像信息和/或答题文本信息,当待阅答题信息中包括答题图像信息时,可以通过图像识别获取答题文本信息。例如,答题图像可以是通过拍照、扫描等手段得到答题图像,进而使用OCR技术对图像进行识别,得到答题文本信息。当然,答题文本信息也可以是计算机答题等方式输入的文本信息,在此不做限定。关于分词处理,可以采用现有常见的分词方法即可,如基于规则的方法、基于序列标注的模型预测方法等,对此本案不做限定。需要说明的是,在本实施例中为了提高后续分词处理的准确度,在本文档来自技高网
...
数学主观题解答结果的结构分析方法及系统

【技术保护点】
一种数学主观题解答结果的结构分析方法,其特征在于,包括:接收待阅答题信息,并对所述待阅答题信息进行分词处理;基于分词处理结果和预先构建的分步模型,得到待阅答题信息的答题步骤;基于答题步骤向量、统计特征向量和预先训练的关系分析模型,得到步骤间关系,所述统计特征向量包括以下任意一种或多种:结构特征、引导词特征、步骤关联特征、关键词特征。

【技术特征摘要】
1.一种数学主观题解答结果的结构分析方法,其特征在于,包括:接收待阅答题信息,并对所述待阅答题信息进行分词处理;基于分词处理结果和预先构建的分步模型,得到待阅答题信息的答题步骤;基于答题步骤向量、统计特征向量和预先训练的关系分析模型,得到步骤间关系,所述统计特征向量包括以下任意一种或多种:结构特征、引导词特征、步骤关联特征、关键词特征。2.根据权利要求1所述的方法,其特征在于,所述步骤间关系包括以下任意一种:推导、并列和重复。3.根据权利要求1所述的方法,其特征在于,所述分步模型为神经网络,包括:向量化模块、多层序列获取模块和分类模块,其中,向量化模块的输入为分词处理得到的词,向量化模块的输出为词向量序列,多层序列获取模块的输入为词向量序列,多层序列获取模块的输出为序列向量,分类模块的输入为序列向量,分类模块的输出为分词点作为分离步骤点的判断结果。4.根据权利要求1所述的方法,其特征在于,所述关系分析模型为卷积神经网络;所述关系分析模型包括:输入层、卷积层、分类层和输出层,其中,输入层的输入为答题步骤向量,卷积层为多层,卷积层的输出为用于确定步骤间关系的分布式特征向量,分类层的输入为分布式特征向量和基于规则提取的统计特征向量,输出层的输出为步骤间关系的判断结果。5.根据权利要求1至4任一项所述的方法,其特征在于,在对所述待阅答题信息进行分词处理之前,所述方法还包括:对所述待阅答题信息进行数学实体识别;所述对所述待阅答题信息进行分词处理包括:基于所述数学实体识别结果对所述待阅答题信息进行分词处理。6.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:对正确答案进行结构分析,得到正确答案的答题步骤和步骤间关系;将所述待阅答题信息的答题步骤、步骤间关系与所述正确答案的答题步骤、步骤间关系进...

【专利技术属性】
技术研发人员:沙晶代旭东盛志超
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1