一种基于自然语言处理的智能策略组卷方法、装置及设备制造方法及图纸

技术编号:32286956 阅读:12 留言:0更新日期:2022-02-12 19:55
本申请提供了一种基于自然语言处理的智能策略组卷方法、装置及设备,该方法通过根据组卷需求在预构建的教材数据库中查找目标教材电子档;利用自然语言处理技术提取所述目标教材电子档中的知识点;根据所述知识点生成组卷策略;根据所述组卷策略在预设题库中查找目标试题,并将所述目标试题组成考试试卷。本申请通过利用自然语言处理技术提取考试的知识点,大大节约了时间,提提高了组卷效率。提提高了组卷效率。提提高了组卷效率。

【技术实现步骤摘要】
一种基于自然语言处理的智能策略组卷方法、装置及设备


[0001]本申请涉及在线教育
,尤其涉及一种基于自然语言处理的智能策略组卷方法、装置及设备。

技术介绍

[0002]随着互联网的发展,计算机已经应用到人生生活中的各个领域,在线教育领域中,自动组卷成为教育系统智能化必备的功能。组卷就是按照用户给定的查询参数抽出最适合要求的试题,组成能够实际使用的试卷的过程。定位这种查询参数成为组卷策略。
[0003]其中,查询参数包括科目、试题类型和知识点等,对于科目、试题类型这种参数比较简单,容易设定,只需要根据需求自行设定即可,在所有查询参数中最难设定的是知识点,例如在一次期末考试时,需要对整个学期的教学内容进行总结、复盘以确定知识点,工作强度较大,耗费的时间较多且效率慢。
[0004]因此,本申请提供一种基于自然语言处理的智能策略组卷方法、装置及设备。

技术实现思路

[0005]本申请实施例的目的在于提供一种基于自然语言处理的智能策略组卷方法、装置及设备,以解决组卷策略的确定耗费人力物力且效率低下的问题。具体技术方案如下:
[0006]第一方面,提供了一种基于自然语言处理的智能策略组卷方法,所述方法包括:
[0007]根据组卷需求在预构建的教材数据库中查找目标教材电子档;
[0008]利用自然语言处理技术提取所述目标教材电子档中的知识点;
[0009]根据所述知识点生成组卷策略;
[0010]根据所述组卷策略在预设题库中查找目标试题,并将所述目标试题组成考试试卷。
[0011]可选地,所述根据组卷需求在预构建的教材数据库中查找目标教材电子档包括:
[0012]获取组卷需求信息;
[0013]提取所述组卷需求信息中的关键词;所述关键词包括教科书版本、科目、年级、学期和章节;
[0014]根据所述关键词在预构建的教材数据库中查找标签;
[0015]根据所述标签查找标签对应的目标教材电子档。
[0016]可选地,所述教材数据库的构建包括如下步骤:
[0017]在网络端获取各年级各科目各版本的教科书的电子文档;
[0018]为各电子文档添加标签后存储在教材数据库中。
[0019]可选地,所述利用自然语言处理技术提取所述目标教材电子档中的知识点包括:
[0020]提取所述组卷需求中的章节信息;
[0021]根据所述章节信息确定所述目标教材电子档中的组卷内容文本;
[0022]对所述组卷内容文本进行预处理得到预处理的组卷文本;
[0023]对所述组卷文本进行分词处理得到若干个文本段;
[0024]根据预设知识点筛选规则查找包含知识点的文本段;
[0025]根据所述包含知识点的文本段构建知识点表格,所述知识点表格包括知识点编号和知识点内容。
[0026]可选地,所述对所述组卷内容文本进行预处理得到预处理的组卷文本包括:
[0027]清洗所述组卷内容文本;
[0028]删除所述组卷内容文本中的不相关字符,所述不相关字符包括非字母、数字字符。
[0029]可选地,所述根据预设知识点筛选规则查找包含知识点的文本段包括:
[0030]确定第一知识点筛选特征和第二知识点筛选特征;所述第一知识点筛选特征为预设的目标字体,所述第二知识点筛选特征为预设的关键词;
[0031]将每个文本段与所述第一知识点筛选特征和第二知识点筛选特征进行匹配;
[0032]将包含有第一知识点筛选特征或第二知识点筛选特征的文本段确定为包含知识点的文本段。
[0033]可选地,所述根据所述知识点生成组卷策略包括:
[0034]为每个知识点设定赋予权重值;
[0035]根据每个知识点及其对应的权重值、编号生成组卷策略。
[0036]第二方面,本申请提供一种基于自然语言处理的在线教育智能策略组卷装置,所述装置包括:
[0037]查找单元,用于根据组卷需求在预构建的教材数据库中查找目标教材电子档;
[0038]提取单元,用于利用自然语言处理技术提取所述目标教材电子档中的知识点;
[0039]生成单元,用于根据所述知识点生成组卷策略;
[0040]组卷单元,用于根据所述组卷策略在预设题库中查找目标试题,并将所述目标试题组成考试试卷。
[0041]第三方面,本申请提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0042]存储器,用于存放计算机程序;
[0043]处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
[0044]第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。
[0045]第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的基于自然语言处理的智能策略组卷方法。
[0046]本申请实施例有益效果:
[0047]本申请实施例提供了一种基于自然语言处理的智能策略组卷方法、装置及设备,本申请通过根据组卷需求在预构建的教材数据库中查找目标教材电子档;利用自然语言处理技术提取所述目标教材电子档中的知识点;根据所述知识点生成组卷策略;根据所述组卷策略在预设题库中查找目标试题,并将所述目标试题组成考试试卷。本申请通过利用自然语言处理技术提取考试的知识点,大大节约了时间,提提高了组卷效率。
[0048]当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
[0049]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0050]图1为本申请实施例提供的一种基于自然语言处理的智能策略组卷方法的流程图;
[0051]图2为本申请实施例提供的一种基于自然语言处理的智能策略组卷装置的结构示意图;
[0052]图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0053]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0054]本申请实施例提供了一种基于自然语言处理的智能策略组卷方法,下面将结合具体实施方式,对本申请实施例提供的一种基于自然语言处理的智能策略组卷方法进行详细的说明,如图1所示,具体步骤如下:
[0055]步骤S101:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自然语言处理的智能策略组卷方法、装置及设备,其特征在于,所述方法包括:根据组卷需求在预构建的教材数据库中查找目标教材电子档;利用自然语言处理技术提取所述目标教材电子档中的知识点;根据所述知识点生成组卷策略;根据所述组卷策略在预设题库中查找目标试题,并将所述目标试题组成考试试卷。2.根据权利要求1所述的方法,其特征在于,所述根据组卷需求在预构建的教材数据库中查找目标教材电子档包括:获取组卷需求信息;提取所述组卷需求信息中的关键词;所述关键词包括教科书版本、科目、年级、学期和章节;根据所述关键词在预构建的教材数据库中查找标签;根据所述标签查找标签对应的目标教材电子档。3.根据权利要求2所述的方法,其特征在于,所述教材数据库的构建包括如下步骤:在网络端获取各年级各科目各版本的教科书的电子文档;为各电子文档添加标签后存储在教材数据库中。4.根据权利要求1所述的方法,其特征在于,所述利用自然语言处理技术提取所述目标教材电子档中的知识点包括:提取所述组卷需求中的章节信息;根据所述章节信息确定所述目标教材电子档中的组卷内容文本;对所述组卷内容文本进行预处理得到预处理的组卷文本;对所述组卷文本进行分词处理得到若干个文本段;根据预设知识点筛选规则查找包含知识点的文本段;根据所述包含知识点的文本段构建知识点表格,所述知识点表格包括知识点编号和知识点内容。5.根据权利要求4所述的方法,其特征在于,所述对所述组卷内容文本进行预处理得到预处理的组卷文本包括:清洗所述组卷内容文本;删除所述组卷内容文本中的不相关字符,所述不相关字符包括非字...

【专利技术属性】
技术研发人员:邓晓强
申请(专利权)人:融安云网北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1