试题文本的知识点确定方法、电子设备及存储介质技术

技术编号:20389907 阅读:27 留言:0更新日期:2019-02-20 02:52
本申请公开了一种试题文本的知识点确定方法、电子设备及存储介质。该方法包括读取预设的知识点列表;对试题文本进行分词处理以获得多个分词;根据知识点列表确定第一类分词集合和第二类分词集合,其中,第一类分词集合为多个分词中包含在预设的知识点列表中的分词集合,第二类分词集合为多个分词中不包含在预设的知识点列表中的分词集合;若第一类分词集合不为空集合,根据预设规则确定第一类分词集合中的一分词作为试题文本的知识点;若第一类分词集合为空集合,确定第二类分词集合中频次最高且包含在预设的关键词列表中的分词作为试题文本的知识点,其中,关键词列表大于知识点列表。以至少部分地解决试题文本分析中建模困难、算法复杂、准确度不高的问题。

【技术实现步骤摘要】
试题文本的知识点确定方法、电子设备及存储介质
本申请涉及人工智能领域,具体而言,涉及一种试题文本的知识点确定方法、电子设备及存储介质。
技术介绍
题库数据是重要的教学资源,而题库中题目的知识点数据项则有着十分重要的作用,它是题库分类检索的重要字段,也是各种延伸应用的基础。在实际的中考和高考中,学生试卷的打分,也是在遵循一个“踏点得分”的原则,即只要考察的知识点按步骤写出来了,即使题没有解出来,也能得到相应部分的分数。然而知识点的生成是一项非常费人工事情,通常需要教学经验丰富的老师根据题意列出知识点,经过审核、录入和校对等环节后再入库,这样每个题目的知识点生产要花2至3元的成本。在题库数量动辄以几百万乃至上千万规模的今天,这无疑是一笔耗资巨大的投入;同时,真正操作时需要的人员组织、管理以及工期耗时都是令人头疼的事。专利文献CN106570109A公开了一种通过文本分析自动生成题库知识点的方法。但是,采用该方法仍然可能会存在建模比较困难、算法复杂、准确度不够高的问题。
技术实现思路
本申请提供了一种试题文本的知识点确定方法、电子设备及存储介质,以至少部分地解决题文本分析中建模困难、算法复杂、本文档来自技高网...

【技术保护点】
1.一种试题文本的知识点确定方法,其特征在于,所述方法包括:读取预设的知识点列表;对所述试题文本进行分词处理以获得多个分词;根据所述知识点列表确定第一类分词集合和第二类分词集合,其中,所述第一类分词集合为所述多个分词中包含在所述预设的知识点列表中的分词集合,所述第二类分词集合为所述多个分词中不包含在所述预设的知识点列表中的分词集合;若所述第一类分词集合不为空集合,根据预设规则确定所述第一类分词集合中的一分词作为所述试题文本的知识点;若所述第一类分词集合为空集合,确定所述第二类分词集合中频次最高且包含在预设的关键词列表中的分词作为所述试题文本的知识点,其中,所述关键词列表大于所述知识点列表。

【技术特征摘要】
1.一种试题文本的知识点确定方法,其特征在于,所述方法包括:读取预设的知识点列表;对所述试题文本进行分词处理以获得多个分词;根据所述知识点列表确定第一类分词集合和第二类分词集合,其中,所述第一类分词集合为所述多个分词中包含在所述预设的知识点列表中的分词集合,所述第二类分词集合为所述多个分词中不包含在所述预设的知识点列表中的分词集合;若所述第一类分词集合不为空集合,根据预设规则确定所述第一类分词集合中的一分词作为所述试题文本的知识点;若所述第一类分词集合为空集合,确定所述第二类分词集合中频次最高且包含在预设的关键词列表中的分词作为所述试题文本的知识点,其中,所述关键词列表大于所述知识点列表。2.根据权利要求1所述的方法,其特征在于,所述知识点列表中包含与所述试题文本的科目对应的多个第一类知识点。3.根据权利要求2所述的方法,其特征在于,所述关键词列表中包含与所述试题文本的科目对应的多个第二类知识点,其中,所述第一类知识点在所述科目中出现的频次大于所述第二类知识点在所述科目中出现的频次。4.根据权利要求1所述的方法,其特征在于,所述对所述试题文本进行分词处理以获得多个分词,包括:基于统计...

【专利技术属性】
技术研发人员:张磊李首峰孙立宏陈放李莉莉
申请(专利权)人:国政通科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1