【技术实现步骤摘要】
为题目打标签的方法、装置、存储介质及电子设备
本专利技术涉及文档分类
,具体涉及一种为题目打标签的方法、装置、存储介质及电子设备。
技术介绍
通常通过为题目打标签,进而将多个题目进行分类,例如,该标签可以具体为题型、难度、知识点等,最终实现了题目与某种维度的关联。目前,为题目打标签是通过人工的方式进行,该方式的正确率较高,但效率较低,需要花费大量的时间及人力成本。因此,如何一种为题目打标签的方法,既能保证正确率,又能提高效率,降低成本,是本领域技术人员亟待解决的一大技术难题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种为题目打标签的方法,既能保证正确率,又能提高效率,降低成本。为实现上述目的,本专利技术实施例提供如下技术方案:一种为题目打标签的方法,包括:确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。可选的,当所述待打标签的题目的类型信息为所述口算类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、答案;基于所述目标文字信息,确定出目标算数表达式;基于上下文无关文算法,对所述目标算数表达式进行解析,得到目标四元组;基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签 ...
【技术保护点】
1.一种为题目打标签的方法,其特征在于,包括:/n确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;/n基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。/n
【技术特征摘要】
1.一种为题目打标签的方法,其特征在于,包括:
确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;
基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。
2.根据权利要求1所述的为题目打标签的方法,其特征在于,当所述待打标签的题目的类型信息为所述口算类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:
获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、答案;
基于所述目标文字信息,确定出目标算数表达式;
基于上下文无关文算法,对所述目标算数表达式进行解析,得到目标四元组;
基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签。
3.根据权利要求2所述的为题目打标签的方法,其特征在于,所述基于所述目标文字信息,确定出目标算数表达式,包括:
基于正则表达式,对所述目标文字信息进行数据清洗,得到去噪文字信息;
对所述去噪文字信息进行信息抽取,得到所述目标算数表达式。
4.根据权利要求2所述的为题目打标签的方法,其特征在于,所述基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签,包括:
获取所述目标四元组中的最大操作数;
获取所述目标算数表达式中的括号信息;
基于所述最大操作数以及所述括号信息,确定所述预设划分规则中符合所述最大操作数以及所述括号信息的标签为所述待打标签的题目的目标标签。
5.根据权利要求1所述的为题目打标签的方法,其特征在于,当所述待打标签的题目的类型信息为所述应用类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:
获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、解析;
对所述目标文字信息进行分词、停词处理,得到词特征集合;
计算所述词特征集合中每个词特征的词频与逆文档频率的比值;
基于所述词频与逆文档频率的比值,训练预设分类器,得到目标分类器;
将所述待打标签的题目输入所述目标分类器,输出所述待打标签的题目的目标标签。
6.一种为题目打标签的装置,其特征在于,包括:
第一确定模块,用于确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;
第二确定模块,用于基于所述待打标签...
【专利技术属性】
技术研发人员:张弦,程辉,邢德阳,董平,
申请(专利权)人:北京一起教育信息咨询有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。