为题目打标签的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:28942814 阅读:20 留言:0更新日期:2021-06-18 21:50
本发明专利技术实施例提供了一种为题目打标签的方法、装置、存储介质及电子设备,该方法首先确定待打标签的题目的类型信息,然后基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,其中,所述类型信息至少包括口算类以及应用类。可见,本方案提供了一种基于题目的类型信息,自动为题目打标签的方式,避免了手动打标签导致的打标签效率低、成本高的问题。

【技术实现步骤摘要】
为题目打标签的方法、装置、存储介质及电子设备
本专利技术涉及文档分类
,具体涉及一种为题目打标签的方法、装置、存储介质及电子设备。
技术介绍
通常通过为题目打标签,进而将多个题目进行分类,例如,该标签可以具体为题型、难度、知识点等,最终实现了题目与某种维度的关联。目前,为题目打标签是通过人工的方式进行,该方式的正确率较高,但效率较低,需要花费大量的时间及人力成本。因此,如何一种为题目打标签的方法,既能保证正确率,又能提高效率,降低成本,是本领域技术人员亟待解决的一大技术难题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种为题目打标签的方法,既能保证正确率,又能提高效率,降低成本。为实现上述目的,本专利技术实施例提供如下技术方案:一种为题目打标签的方法,包括:确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。可选的,当所述待打标签的题目的类型信息为所述口算类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、答案;基于所述目标文字信息,确定出目标算数表达式;基于上下文无关文算法,对所述目标算数表达式进行解析,得到目标四元组;基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签。可选的,所述基于所述目标文字信息,确定出目标算数表达式,包括:基于正则表达式,对所述目标文字信息进行数据清洗,得到去噪文字信息;对所述去噪文字信息进行信息抽取,得到所述目标算数表达式。可选的,所述基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签,包括:获取所述目标四元组中的最大操作数;获取所述目标算数表达式中的括号信息;基于所述最大操作数以及所述括号信息,确定所述预设划分规则中符合所述最大操作数以及所述括号信息的标签为所述待打标签的题目的目标标签。可选的,当所述待打标签的题目的类型信息为所述应用类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、解析;对所述目标文字信息进行分词、停词处理,得到词特征集合;计算所述词特征集合中每个词特征的词频与逆文档频率的比值;基于所述词频与逆文档频率的比值,训练预设分类器,得到目标分类器;将所述待打标签的题目输入所述目标分类器,输出所述待打标签的题目的目标标签。一种为题目打标签的装置,包括:第一确定模块,用于确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;第二确定模块,用于基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。可选的,当所述待打标签的题目的类型信息为所述口算类时,所述第二确定模块包括:第一获取单元,用于获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、答案;第一确定单元,用于基于所述目标文字信息,确定出目标算数表达式;第一处理单元,用于基于上下文无关文算法,对所述目标算数表达式进行解析,得到目标四元组;第二确定单元,用于基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签;或,当所述待打标签的题目的类型信息为所述应用类时,所述第二确定模块包括:第二获取单元,用于获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、解析;第二处理单元,用于对所述目标文字信息进行分词、停词处理,得到词特征集合;计算单元,用于计算所述词特征集合中每个词特征的词频与逆文档频率的比值;第三处理单元,用于基于所述词频与逆文档频率的比值,训练预设分类器,得到目标分类器;输出单元,用于将所述待打标签的题目输入所述目标分类器,输出所述待打标签的题目的目标标签。可选的,所述第一确定单元包括:第一处理子单元,用于基于正则表达式,对所述目标文字信息进行数据清洗,得到去噪文字信息;第二处理子单元,用于对所述去噪文字信息进行信息抽取,得到所述目标算数表达式;和/或,所述第二确定单元包括:第一获取子单元,用于获取所述目标四元组中的最大操作数;第二获取子单元,用于获取所述目标算数表达式中的括号信息;确定子单元,用于基于所述最大操作数以及所述括号信息,确定所述预设划分规则中符合所述最大操作数以及所述括号信息的标签为所述待打标签的题目的目标标签。一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行任意一项上述的为题目打标签的方法。一种电子设备,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行任意一项上述的为题目打标签的方法。基于上述技术方案,本专利技术实施例提供了一种为题目打标签的方法、装置、存储介质及电子设备,该方法首先确定待打标签的题目的类型信息,然后基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,其中,所述类型信息至少包括口算类以及应用类。可见,本方案提供了一种基于题目的类型信息,自动为题目打标签的方式,避免了手动打标签导致的打标签效率低、成本高的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种为题目打标签的方法的流程示意图;图2为本专利技术实施例提供的一种为题目打标签的方法的又一流程示意图;图3为本专利技术实施例提供的一种为题目打标签的方法的又一流程示意图;图4为本专利技术实施例提供的一种为题目打标签的方法的又一流程示意图;图5为本专利技术实施例提供的一种为题目打标签的方法的又一流程示意图;图6为本专利技术实施例提供的一种为题目打标签的装置的结构示意图;图7为本专利技术实施例提供的一种为题目打标签的系统的硬件架构图。具体实施方式请参阅图1,图1为本专利技术实施例提供的一种为题目打标签的方法的流程示意图,该方法包括:S11、确定待打标签的题目的类型信息。S12、基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。需要说明本文档来自技高网...

【技术保护点】
1.一种为题目打标签的方法,其特征在于,包括:/n确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;/n基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。/n

【技术特征摘要】
1.一种为题目打标签的方法,其特征在于,包括:
确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;
基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。


2.根据权利要求1所述的为题目打标签的方法,其特征在于,当所述待打标签的题目的类型信息为所述口算类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:
获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、答案;
基于所述目标文字信息,确定出目标算数表达式;
基于上下文无关文算法,对所述目标算数表达式进行解析,得到目标四元组;
基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签。


3.根据权利要求2所述的为题目打标签的方法,其特征在于,所述基于所述目标文字信息,确定出目标算数表达式,包括:
基于正则表达式,对所述目标文字信息进行数据清洗,得到去噪文字信息;
对所述去噪文字信息进行信息抽取,得到所述目标算数表达式。


4.根据权利要求2所述的为题目打标签的方法,其特征在于,所述基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签,包括:
获取所述目标四元组中的最大操作数;
获取所述目标算数表达式中的括号信息;
基于所述最大操作数以及所述括号信息,确定所述预设划分规则中符合所述最大操作数以及所述括号信息的标签为所述待打标签的题目的目标标签。


5.根据权利要求1所述的为题目打标签的方法,其特征在于,当所述待打标签的题目的类型信息为所述应用类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:
获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、解析;
对所述目标文字信息进行分词、停词处理,得到词特征集合;
计算所述词特征集合中每个词特征的词频与逆文档频率的比值;
基于所述词频与逆文档频率的比值,训练预设分类器,得到目标分类器;
将所述待打标签的题目输入所述目标分类器,输出所述待打标签的题目的目标标签。


6.一种为题目打标签的装置,其特征在于,包括:
第一确定模块,用于确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;
第二确定模块,用于基于所述待打标签...

【专利技术属性】
技术研发人员:张弦程辉邢德阳董平
申请(专利权)人:北京一起教育信息咨询有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1