一种理科相似题推荐方法、装置、设备及可读存储介质制造方法及图纸

技术编号:32221675 阅读:21 留言:0更新日期:2022-02-09 17:26
本申请涉及一种理科相似题推荐方法、装置、设备及可读存储介质,涉及教育技术领域,包括:将待处理试题导入试题文本向量模型,得到待处理试题的文本特征向量;抽取待处理试题中公式的基础特征向量和公式知识特征向量,将抽取得到的基础特征向量和公式知识特征向量进行拼接,得到待处理试题的公式特征向量;对待处理试题进行知识实体抽取,将知识实体导入学科知识体系模型,得到待处理试题的知识点特征向量;将文本特征向量、公式特征向量和知识点特征向量进行拼接和融合,得到待处理试题的综合特征向量;将综合特征向量与预设题库中历史试题的综合特征向量进行相似度计算,根据相似度确定待推荐相似题。本申请可有效提高试题推荐的准确性。荐的准确性。荐的准确性。

【技术实现步骤摘要】
一种理科相似题推荐方法、装置、设备及可读存储介质


[0001]本申请涉及教育
,特别涉及一种理科相似题推荐方法、装置、设备及可读存储介质。

技术介绍

[0002]随着互联网技术的快速发展,互联网技术已经渗入到教育行业的方方面面,使得越来越多的人通过将互联网技术与因材施教相结合来提高因材施教的可行性,比如,可通过互联网技术向学生推荐相似题进行有针对性的试题练习,进而为学生提供更加多元化和个性化的教学方案。
[0003]相关技术中,往往是直接利用试题自身信息的通用试题进行相似题推荐(其不携带用户偏好信息),该通用试题推荐方法主要涉及文科题目领域,比如通过对试题进行句法分析,得到存在句法关联的关联分词,基于试题间关联分词之间的相似度,实现语法变式题的推荐。但是,由于理科试题中往往包含公式等具有理科特性的关键信息,该关键信息无法通过简单的文本处理得到,以致缺乏对理科试题中关键特征的充分利用,进而导致试题推荐的准确性较差。

技术实现思路

[0004]本申请提供一种理科相似题推荐方法、装置、设备及可读存储介质,以解决相关技术中存在的试题推荐的准确性较差的问题。
[0005]第一方面,提供了一种理科相似题推荐方法,包括以下步骤:
[0006]将待处理试题导入试题文本向量模型,得到所述待处理试题的文本特征向量;
[0007]抽取所述待处理试题中公式的基础特征向量和公式知识特征向量,将抽取得到的基础特征向量和公式知识特征向量进行拼接,得到所述待处理试题的公式特征向量;
[0008]对所述待处理试题进行知识实体抽取,将所述知识实体导入学科知识体系模型,得到所述待处理试题的知识点特征向量;
[0009]将所述文本特征向量、所述公式特征向量和所述知识点特征向量进行拼接和融合,得到所述待处理试题的综合特征向量;
[0010]将所述待处理试题的综合特征向量与预设题库中历史试题的综合特征向量进行相似度计算,根据所述相似度确定待推荐相似题。
[0011]一些实施例中,所述抽取所述待处理试题中公式的基础特征向量,包括:
[0012]基于TangentCRF模型识别出所述待处理试题中的所有公式;
[0013]对各个所述公式进行树形结构的归一化处理,生成公式元组集合;
[0014]基于FastText n

gram词嵌入模型分别对所述公式元组集合中的各组公式元组进行词嵌入处理,得到基础特征向量,所述基础特征向量包括公式位置、公式数量和公式自身信息。
[0015]一些实施例中,所述抽取所述待处理试题中公式的公式知识特征向量,包括:
[0016]基于所述基础特征向量从预设的公式库中查找出与所述待处理试题中公式相关的历史公式,所述公式库包括历史公式与知识点之间的映射关系;
[0017]将所述历史公式的知识点进行融合,得到所述待处理试题中公式的公式知识特征向量。
[0018]一些实施例中,在所述将所述知识实体导入学科知识体系模型的步骤之前,还包括:
[0019]对历史试题的知识实体进行抽取,基于抽取出的知识实体构建各个学科的知识图谱;
[0020]基于所述知识图谱创建学科知识体系模型。
[0021]一些实施例中,所述将所述待处理试题的综合特征向量分别与预设题库中历史试题的综合特征向量进行相似度计算,包括:
[0022]基于Faiss高维向量查询工具计算所述待处理试题的综合特征向量与预设题库中历史试题的综合特征向量的相似度。
[0023]一些实施例中,所述根据所述相似度确定待推荐相似题,包括:
[0024]按照相似度由高到低的顺序,对所述历史试题进行排序,得到排序队列;
[0025]从所述排序队列中选取排列在前N位的历史试题作为待推荐相似题。
[0026]一些实施例中,在所述将待处理试题导入试题文本向量模型的步骤之前,还包括:
[0027]基于历史试题和预训练词向量创建试题文本向量模型。
[0028]第二方面,提供了一种理科相似题推荐装置,包括:
[0029]第一处理单元,其用于将待处理试题导入试题文本向量模型,得到所述待处理试题的文本特征向量;
[0030]第二处理单元,其用于抽取所述待处理试题中公式的基础特征向量和公式知识特征向量,将抽取得到的基础特征向量和公式知识特征向量进行拼接,得到所述待处理试题的公式特征向量;
[0031]第三处理单元,其用于对所述待处理试题进行知识实体抽取,将所述知识实体导入学科知识体系模型,得到所述待处理试题的知识点特征向量;
[0032]拼接融合单元,其用于将所述文本特征向量、所述公式特征向量和所述知识点特征向量进行拼接和融合,得到所述待处理试题的综合特征向量;
[0033]计算单元,其用于将所述待处理试题的综合特征向量与预设题库中历史试题的综合特征向量进行相似度计算,根据所述相似度确定待推荐相似题。
[0034]第三方面,提供了一种理科相似题推荐设备,包括:存储器和处理器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行,以实现前述的理科相似题推荐方法。
[0035]第四方面,提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行前述的理科相似题推荐方法。
[0036]本申请提供的技术方案带来的有益效果包括:可有效提高理科试题推荐的准确性。
[0037]本申请提供了一种理科相似题推荐方法、装置、设备及可读存储介质,包括:将待
处理试题导入试题文本向量模型,得到所述待处理试题的文本特征向量;抽取所述待处理试题中公式的基础特征向量和公式知识特征向量,将抽取得到的基础特征向量和公式知识特征向量进行拼接,得到所述待处理试题的公式特征向量;对所述待处理试题进行知识实体抽取,将所述知识实体导入学科知识体系模型,得到所述待处理试题的知识点特征向量;将所述文本特征向量、所述公式特征向量和所述知识点特征向量进行拼接和融合,得到所述待处理试题的综合特征向量;将所述待处理试题的综合特征向量与预设题库中历史试题的综合特征向量进行相似度计算,根据所述相似度确定待推荐相似题。本申请通过文本、公式、知识点三个维度对待处理试题中的信息进行了提取和增强,对理科试题数据进行了充分的挖掘,极大地提升题目信息表征向量的质量,进而有效提高试题推荐的准确性。
附图说明
[0038]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1为本申请实施例提供的一种理科相似题推荐方法的流程示意图;
[0040]图2为本申请实施例提供的一种理科相似题推荐装置的结构示意图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种理科相似题推荐方法,其特征在于,包括以下步骤:将待处理试题导入试题文本向量模型,得到所述待处理试题的文本特征向量;抽取所述待处理试题中公式的基础特征向量和公式知识特征向量,将抽取得到的基础特征向量和公式知识特征向量进行拼接,得到所述待处理试题的公式特征向量;对所述待处理试题进行知识实体抽取,将所述知识实体导入学科知识体系模型,得到所述待处理试题的知识点特征向量;将所述文本特征向量、所述公式特征向量和所述知识点特征向量进行拼接和融合,得到所述待处理试题的综合特征向量;将所述待处理试题的综合特征向量与预设题库中历史试题的综合特征向量进行相似度计算,根据所述相似度确定待推荐相似题。2.如权利要求1所述的理科相似题推荐方法,其特征在于,所述抽取所述待处理试题中公式的基础特征向量,包括:基于TangentCRF模型识别出所述待处理试题中的所有公式;对各个所述公式进行树形结构的归一化处理,生成公式元组集合;基于FastText n

gram词嵌入模型分别对所述公式元组集合中的各组公式元组进行词嵌入处理,得到基础特征向量,所述基础特征向量包括公式位置、公式数量和公式自身信息。3.如权利要求2所述的理科相似题推荐方法,其特征在于,所述抽取所述待处理试题中公式的公式知识特征向量,包括:基于所述基础特征向量从预设的公式库中查找出与所述待处理试题中公式相关的历史公式,所述公式库包括历史公式与知识点之间的映射关系;将所述历史公式的知识点进行融合,得到所述待处理试题中公式的公式知识特征向量。4.如权利要求1所述的理科相似题推荐方法,其特征在于,在所述将所述知识实体导入学科知识体系模型的步骤之前,还包括:对历史试题的知识实体进行抽取,基于抽取出的知识实体构建各个学科的知识图谱;基于所述知识图谱创建学科知识体系模型。5.如权利要求1所述的理科相似题推荐方法,其特征在于,所述将所述待处理试题的综...

【专利技术属性】
技术研发人员:熊丹妮邓璇汤博阳张新访邓嘉
申请(专利权)人:武汉天喻信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1