题目分类方法及装置制造方法及图纸

技术编号:34444268 阅读:12 留言:0更新日期:2022-08-06 16:37
本申请提供一种题目分类方法及装置,其中所述题目分类方法包括:获取待分类的题目信息以及所述题目信息对应的科目类别;将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量;根据所述科目类别,在所述题目分类模型中的分类模块中确定目标分类模块;将所述编码向量输入所述目标分类模块进行分类处理,获得所述题目信息对应的章节类型。实现了通过题目分类模型中包含的多个分类模块对不同科目类别的题目信息进行分类处理,不仅能够减少人工分类所消耗的人力成本以及时间成本,并且避免了为每个科目类别,单独部署一个题目分类模型,降低了模型部署的成本。降低了模型部署的成本。降低了模型部署的成本。

【技术实现步骤摘要】
题目分类方法及装置


[0001]本申请涉及数据处理
,特别涉及一种题目分类方法及装置、计算设备和计算机可读存储介质。

技术介绍

[0002]实际应用中,通常需要将每个科目的题目信息按照其章节类型进行标记,然后再录入系统,供后续检索、推荐等使用。目前,很多情况采用人工的方式对题目信息的章节类型进行标记。由于不同老师存在认知差异,标记结果经常不一致。在标记过程中,浏览海量的题目和章节需要耗费大量精力,因此标记也常常出错。而采用深度学习模型的方式对题目信息的章节类型进行标记,虽然能够缓解人工问题,但每新增一个科目类别,就要新部署一个模型,训练和部署成本较高。此外,由于带标注的训练数据资源难以获取,使用多个模型进行训练,每个模型无法从其他科目的训练数据中受益,导致模型精度欠佳。因此,亟需要提供一种可以解决上述问题的技术方案。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种题目分类方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0004]根据本申请实施例的第一方面,提供了一种题目分类方法,包括:
[0005]获取待分类的题目信息以及所述题目信息对应的科目类别;
[0006]将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量;
[0007]根据所述科目类别,在所述题目分类模型中的分类模块中确定目标分类模块;
[0008]将所述编码向量输入所述目标分类模块进行分类处理,获得所述题目信息对应的章节类型。
[0009]可选地,所述根据所述科目类别,在所述题目分类模型中的分类模块中确定目标分类模块,包括:
[0010]将所述科目类别与所述题目分类模型中包含的分类模块对应的科目类别进行对比;
[0011]将对比一致的科目类别对应的分类模块确定为目标分类模块。
[0012]可选地,所述题目分类模型,通过如下方式进行训练:
[0013]获取训练样本集,其中,所述训练样本集中包含至少两种科目类别对应的训练样本;
[0014]通过所述训练样本集中包含的训练样本对初始题目分类模型进行模型训练,直至获得满足训练停止条件的题目分类模型。
[0015]可选地,所述将所述题目信息输入题目分类模型中的编码模块编码处理,获得编码向量之前,还包括:
[0016]在所述题目信息中确定与预设无效信息匹配的无效题目信息;
[0017]将所述无效题目信息在所述题目信息中删除,获得有效题目信息,将所述有效题目信息作为所述题目信息。
[0018]可选地,在所述题目信息中包含多个子信息的情况下,所述将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量之前,还包括:
[0019]将所述题目信息包含的子信息行拼接处理,获得拼接题目信息;
[0020]将所述拼接题目信息作为所述题目信息执行所述将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量。
[0021]可选地,所述将所述编码向量输入所述目标分类模块进行分类处理,获得所述题目信息对应的章节类型,包括:
[0022]将所述编码向量输入所述目标分类模块,获得所述目标分类模块输出的章节标签的概率;
[0023]根据所述章节标签的概率,确定所述题目信息对应的章节类型。
[0024]可选地,所述题目信息,由问题信息组成;或
[0025]所述题目信息由所述问题信息以及所述问题信息对应的答案信息组成;或
[0026]所述题目信息由所述问题信息以及所述问题信息对应的答案解析信息组成;或
[0027]所述题目信息由所述问题信息、所述问题信息对应的答案信息以及所述问题信息对应的答案解析信息组成。
[0028]可选地,所述题目分类方法,还包括:
[0029]建立所述题目信息以及所述章节类型之间的对应关系并存储;
[0030]接收用户提交的题目查询指令,其中,所述题目查询指令中包含章节类型;
[0031]基于所述章节类型以及所述对应关系进行题目查询,获得所述章节类型对应的题目信息并返回至所述用户。
[0032]根据本申请实施例的第二方面,提供了一种题目分类装置,包括:
[0033]获取模块,被配置为获取待分类的题目信息以及所述题目信息对应的科目类别;
[0034]编码模块,被配置为将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量;
[0035]确定模块,被配置为根据所述科目类别,在所述题目分类模型中的分类模块中确定目标分类模块;
[0036]分类模块,被配置为将所述编码向量输入所述目标分类模块进行分类处理,获得所述题目信息对应的章节类型。
[0037]根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现所述题目分类方法的步骤。
[0038]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,所述计算机指令被处理器执行时实现所述题目分类方法的步骤。
[0039]本申请实施例中,通过获取待分类的题目信息以及所述题目信息对应的科目类别;将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量;根据所述科目类别,在所述题目分类模型中的分类模块中确定目标分类模块,实现了在题目分类模型中的多个分类模块中选取与科目类别对应的目标分类模块;将所述编码向量输入所述
目标分类模块进行分类处理,获得所述题目信息对应的章节类型。实现了通过题目分类模型中包含的多个分类模块对不同科目类别的题目信息进行分类处理,不仅能够减少人工分类所消耗的人力成本以及时间成本,并且避免了为每个科目类别,单独部署一个题目分类模型,降低了模型部署的成本。
附图说明
[0040]图1是本申请一实施例提供的计算设备的结构框图;
[0041]图2是本申请一实施例提供的题目分类方法的流程图;
[0042]图3是本申请一实施例提供的题目分类方法中分类模块的示意图;
[0043]图4是本申请一实施例提供的一种应用于实际场景中的题目分类方法的处理流程图;
[0044]图5是本申请一实施例提供的题目分类方法中文本处理的流程图;
[0045]图6是本申请一实施例提供的题目分类装置的结构示意图。
具体实施方式
[0046]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0047]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种题目分类方法,其特征在于,包括:获取待分类的题目信息以及所述题目信息对应的科目类别;将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量;根据所述科目类别,在所述题目分类模型中的分类模块中确定目标分类模块;将所述编码向量输入所述目标分类模块进行分类处理,获得所述题目信息对应的章节类型。2.根据权利要求1所述的题目分类方法,其特征在于,所述根据所述科目类别,在所述题目分类模型中的分类模块中确定目标分类模块,包括:将所述科目类别与所述题目分类模型中包含的分类模块对应的科目类别进行对比;将对比一致的科目类别对应的分类模块确定为目标分类模块。3.根据权利要求1所述的题目分类方法,其特征在于,所述题目分类模型,通过如下方式进行训练:获取训练样本集,其中,所述训练样本集中包含至少两种科目类别对应的训练样本;通过所述训练样本集中包含的训练样本对初始题目分类模型进行模型训练,直至获得满足训练停止条件的题目分类模型。4.根据权利要求1所述的题目分类方法,其特征在于,所述将所述题目信息输入题目分类模型中的编码模块编码处理,获得编码向量之前,还包括:在所述题目信息中确定与预设无效信息匹配的无效题目信息;将所述无效题目信息在所述题目信息中删除,获得有效题目信息,将所述有效题目信息作为所述题目信息。5.根据权利要求1所述的题目分类方法,其特征在于,在所述题目信息中包含多个子信息的情况下,所述将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量之前,还包括:将所述题目信息包含的子信息行拼接处理,获得拼接题目信息;将所述拼接题目信息作为所述题目信息执行所述将所述题目信息输入题目分类模型中的编码模块进行编码处理,获得编码向量。6.根据权利要求1所述的题目分类方法,其特征在于,所述将所述编码向量输入所述目标分...

【专利技术属性】
技术研发人员:吴通通赵薇柳景明李旭
申请(专利权)人:北京飞象星球科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1