试题结构化方法、装置、介质,及电子设备制造方法及图纸

技术编号:38664644 阅读:14 留言:0更新日期:2023-09-02 22:46
本公开实施例提供了一种试题结构化方法、装置、介质,及电子设备,涉及数据处理技术领域。其中该方法包括如下步骤:获取目标试题的语义向量;将语义向量输入预训练的试题分类模型,得到关于目标试题的分类结果,分类结果至少包括以下信息:试题序号、答案序号、试题题干,以及试题答案;根据试题序号与答案序号进行第一匹配,并根据第一匹配的结果对目标试题进行结构化;和/或根据试题题干与试题答案进行第二匹配,并根据所述第二匹配的结果对目标试题进行结构化。通过本方案,可以将多种格式的试题生成结构化试题,并且提高对试题进行结构化的准确性。构化的准确性。构化的准确性。

【技术实现步骤摘要】
试题结构化方法、装置、介质,及电子设备


[0001]本公开涉及数据处理
,尤其涉及一种试题结构化方法、装置、介质,及电子设备。

技术介绍

[0002]在编制试卷的过程中,时常需要将不同种类的题型进行结构化,以使不同种类的试题转换为相同种类的试题。
[0003]现有的将试题结构化的手段,主要是根据特定规则将试题文本进行结构化,无法将多种文本组织方式构成的试题进行结构化,只能满足特定格式试卷的结构化要求,而试卷的组织方式较多,难以覆盖全部场景,普适性较差。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的目的在于提供一种试题结构化方法、装置、介质,及电子设备。针对所展示的内容,本公开至少可以将多种格式的试题生成结构化试题,并且提高了对试题进行结构化的准确性。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种试题结构化方法,包括:获取目标试题的语义向量;将所述语义向量输入预训练的试题分类模型,得到关于所述目标试题的分类结果,所述分类结果至少包括以下信息:试题序号、答案序号、试题题干,以及试题答案;根据所述试题序号与所述答案序号进行第一匹配,并根据所述第一匹配的结果对所述目标试题进行结构化;和/或,根据所述试题题干与所述试题答案进行第二匹配,并根据所述第二匹配的结果对所述目标试题进行结构化。
[0007]根据本公开的另一个方面,提供一种试题结构化的装置,包括:获取模块:用于获取所述HTML文档中的目标内容,并对所述目标内容进行预处理,所述目标内容包括:段落信息、文本信息,以及图片信息;
[0008]分类模块:用于将预处理后的目标内容输入预训练的模型,得到关于所述目标内容的语义向量;结构化模块:用于根据所述试题序号与所述答案序号进行第一匹配,并根据所述第一匹配的结果对所述目标试题进行结构化;和/或,根据所述试题题干与所述试题答案进行第二匹配,并根据所述第二匹配的结果对所述目标试题进行结构化。
[0009]根据本公开的又一个方面,提供一种电子设备,包括存储器、处理器以及存储在上述存储器中并可在所述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述实施例中的试题结构化方法。
[0010]根据本公开的再一个方面,提供一种可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现如上述实施例中的试题结构化方法。
[0011]本公开实施例提供的技术方案可以包括以下有益效果:
[0012]在本公开的一些实施例所提供的技术方案中,均进行以下处理,包括:获取目标试题的语义向量;将上述语义向量输入预训练的试题分类模型,得到关于上述目标试题的分类结果,上述分类结果至少包括以下信息:试题序号、答案序号、试题题干,以及试题答案;根据上述试题序号与上述答案序号进行第一匹配,并根据上述第一匹配的结果对上述目标试题进行结构化;和/或,根据上述试题题干与上述试题答案进行第二匹配,并根据上述第二匹配的结果对上述目标试题进行结构化。通过上述方案,可以将多种格式的试题生成结构化试题,并且提高对试题进行结构化的准确性。
[0013]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0014]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1示意性示出了可以应用本公开一实施例的试题结构化方法的示例性应用场景的示意图。
[0016]图2示意性示出了根据本公开示例性的实施例中试题结构化方法的流程示意图。
[0017]图3示意性示出了根据本公开示例性的实施例中获取语义向量的方法流程图。
[0018]图4示意性示出了根据本公开示例性的实施例中试题分类的方法流程图。
[0019]图5示意性示出了根据本公开示例性的实施例中序号匹配的方法流程图。
[0020]图6示意性示出了根据本公开示例性的实施例中myers算法示意图。
[0021]图7示意性示出了根据本公开示例性的实施例中合并题目与答案的流程图。
[0022]图8示意性示出了根据本公开示例性的实施例中匹配题目与答案的方法流程图。
[0023]图9示意性示出了根据本公开示例性的实施例中模型优化的方法流程图。
[0024]图10示意性示出了根据本公开示例性的实施例中对试题区域进行调整的示意图。
[0025]图11示意性示出了根据本公开示例性的实施例中对试题内容进行调整的示意图。
[0026]图12示意性示出了根据本公开示例性的实施例中试题结构化的装置的结构图。
[0027]图13示出了根据本公开示例性的实施例中另一试题结构化的装置的结构图。
[0028]图14示意性示出了根据本公开一示例性的实施例中电子设备的结构图。
具体实施方式
[0029]为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施例方式作进一步地详细描述。
[0030]下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0031]在本公开的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本公开中的具体含义。此外,在本公开的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0032]参考图1,示意性示出了可以应用本公开一实施例的试题结构化方法的示例性应用场景的示意图。
[0033]如图1所示,包括目标试题110、语义获取模型120、试题分类模型130,以及结构化试题140。
[0034]其中,上述目标试题110所涵盖的题型包括但不限于:选择题、填空题、判断题,以及简答题。上述目标试题110指的是包含有试题信息的文档,上述试题信息包括但不限于:试题序号、序号级别、试题题干、试题选项、试题答案、试题解析、试题知识点、试题难度、题型;上述文档类型包括但不限于:Word(Microsoft Office Word,文档)、PDF(Portab本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试题结构化的方法,其特征在于,所述方法包括:获取目标试题的语义向量;将所述语义向量输入预训练的试题分类模型,得到关于所述目标试题的分类结果,所述分类结果至少包括以下信息:试题序号、答案序号、试题题干,以及试题答案;根据所述试题序号与所述答案序号进行第一匹配,并根据所述第一匹配的结果对所述目标试题进行结构化;和/或,根据所述试题题干与所述试题答案进行第二匹配,并根据所述第二匹配的结果对所述目标试题进行结构化。2.根据权利要求1所述的试题结构化的方法,其特征在于,所述获取目标试题的语义向量,包括:将包含所述目标试题的文档,转换为超文本标记语言HTML文档;获取所述HTML文档中的目标内容,所述目标内容包括:文本与图片标识符,其中所述图片标识符是对图片进行替换得到的;将所述目标内容输入预训练的语义获取模型,得到所述语义向量。3.根据权利要求1所述的试题结构化的方法,其特征在于,所述试题分类模型是通过目标训练集,对所述语义获取模型进行训练得到的;其中,所述目标训练集包括以下题型的一种或多种:选择题、填空题、判断题,以及简答题。4.根据权利要求1所述的试题结构化的方法,其特征在于,所述将所述语义向量输入预训练的试题分类模型,得到关于所述目标试题的分类结果,包括:将所述语义向量输入预训练的分段模型,得到N个分割点,N为正整数;根据所述分割点,对所述语义向量进行分段,得到语义子向量;将所述语义子向量输入所述试题分类模型,得到关于所述目标试题的分类结果。5.根据权利要求1所述的试题结构化方法,其特征在于,所述根据所述试题序号与所述答案序号进行第一匹配,包括:确定所述试题序号与所述答案序号的最小编辑路径;根据所述最小编辑路径,对所述题目序号与所述答案序号进行匹配。6.根据权利要求1所述的试题结构化方法,其特...

【专利技术属性】
技术研发人员:许旭东
申请(专利权)人:广州视睿电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1