一种相似题目的推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:20866326 阅读:32 留言:0更新日期:2019-04-17 09:19
本公开实施例公开了一种相似题目的推荐方法、装置、电子设备及存储介质,该方法包括:对目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量;计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度;根据所述相似度生成所述目标题目的推荐题,以提高相似题推荐的准确度。其中,通过将题目转化成知识点向量,通过计算题目知识点向量之间的相似度,来衡量题目的相似度,避免了单纯基于知识点标签和文本之间的距离来寻找相似题目出现的不准确和不全面甚至错误推荐题的问题。

【技术实现步骤摘要】
一种相似题目的推荐方法、装置、电子设备及存储介质
本公开涉及教育互联网
,尤其涉及一种相似题目的推荐方法、装置、电子设备及存储介质。
技术介绍
现在相似题推荐在K12(kindergartenthroughtwelfthgrade)教育领域有着非常广泛的应用,相似题推荐的应用程序可以根据学生的历史错题生成相似题,以供学生进行巩固练习,或者根据教师检索的题目推荐相似题等。相似题推荐技术的核心在于计算题目与题目之间的相似度,现有的技术方案一般是首先使用题目的知识点标签,找出同一知识点下面的备选题。再基于文本相似度,计算题目文本和题库中题目的文本之间的相似性,找出相似度高的题目作为推荐。这种方法有存在如下问题:第一,题目文本的相似性并不等价于题目的相似性。因为题目本身的特殊性,有时变化了一个数字,就会导致整道题的解题方法完全不一样。而有的题目虽然表述完全不一样,但是用到的方法和知识点却是非常相似的。第二,推荐题目的质量往往受限于标签的质量,如果标签有误则推荐一定错误。即使标签是合理的,单一知识点标签往往也无法涵盖题目涉及的所有知识点。因此,现有技术的推荐相似题会出现不准确,甚至错误的问题。
技术实现思路
本公开提供一种相似题的推荐方法、装置、电子设备及存储介质,解决了现有技术中相似题推荐不准确甚至是错误的问题。第一方面,本公开实施例提供了一种相似题目的推荐方法,包括:对目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量;计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度;根据所述相似度生成所述目标题目的推荐题。进一步的,计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度,包括:计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的距离;相应的,根据所述相似度生成所述目标题目的推荐题,包括:根据所述距离生成所述目标题目的推荐题。进一步的,对所述目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量,包括:通过神经网络对所述目标题目的题目数据进行处理,得到所述目标题目在各知识点上的概率分布向量,作为第一概率分布向量;其中,所述题目数据包括文本、公式和/或图片。进一步的,若所述目标题目带有知识点标签,相应的,得到所述目标题目在各知识点上的概率分布向量之后,还包括:根据所述知识点标签计算所述目标题目在各知识点对应的概率分布向量,作为第二概率分布;根据所述第一概率分布和所述第二概率分布计算所述目标题目在各知识点上的综合概率分布向量,并将所述综合概率分布向量作为最终的概率分布向量;其中,所述知识点标签用于显示题目所包括的知识点内容。进一步的,根据所述相似度生成所述目标题目的推荐题之后,包括:对所述推荐题进行去重;其中,所述去重包括:去掉所述推荐题中重复的题目和/或与所述目标题目相同的题目。进一步的,对所述推荐题进行去重,包括:根据所述推荐题中所有题目之间的距离指标以及所述推荐题与所述目标题目之间的距离指标在所述推荐题中进行去重;和/或利用题目分类器在所述推荐题中进行去重。进一步的,根据所述相似度生成所述目标题目的推荐题,包括:根据预设的推荐题数目和所述相似度,生成相应数目的推荐题。进一步的,根据所述相似度生成所述目标题目的推荐题之后,还包括:根据用户做题的历史情况和使用要求对所述推荐题进行筛选。进一步的,根据用户做题的历史情况和使用要求对所述推荐题进行筛选,包括以下至少之一:根据用户做题的历史情况去除预设时间内做过的题目;根据艾宾浩斯记忆曲线去除记忆程度高于预设阈值的题目;根据用户做所述目标题目的对错情况,调整推荐题的难度。第二方面,本公开实施例还提供了一种相似题目的推荐装置,包括:向量计算模块,用于对目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量;相似度计算模块,用于计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度;推荐题生成模块,用于根据所述相似度生成所述目标题目的推荐题。进一步的,所述相似度计算模块,包括:向量距离计算单元,用于计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的距离;相应的,所述推荐题生成模块,包括:推荐题生成单元,用于根据所述距离生成所述目标题目的推荐题。进一步的,所述相似度计算模块,包括:第一向量计算单元,用于通过神经网络对所述目标题目的题目数据进行处理,得到所述目标题目在各知识点上的概率分布向量,作为第一概率分布;其中,所述题目数据包括文本、公式和/或图片。进一步的,所述向量计算模块包括:第二向量计算单元,用于若所述目标题目带有知识点标签,得到所述目标题目在各知识点上的概率分布向量之后,根据所述知识点标签计算所述目标题目在各知识点对应的概率分布向量,作为第二概率分布向量;综合向量计算单元,用于根据所述第一概率分布和所述第二概率分布计算所述目标题目在各知识点上的综合概率分布向量,并将所述综合概率分布向量作为最终的概率分布向量;其中,所述知识点标签用于显示题目所包括的知识点内容。进一步的,所述装置还包括:推荐题去重模块,用于根据所述相似度生成所述目标题目的推荐题之后,对所述推荐题进行去重;其中,所述去重包括:去掉所述推荐题中重复的题目和/或与所述目标题目相同的题目。进一步的,所述推荐题去重模块包括:距离去重单元,用于根据所述推荐题中所有题目之间的距离指标以及所述推荐题与所述目标题目之间的距离指标在所述推荐题中进行去重;和/或分类器去重单元,用于利用题目分类器在所述推荐题中进行去重。进一步的,所述推荐题生成模块,还包括:推荐题数据设置单元,用于根据预设的推荐题数目和所述相似度,生成相应数目的推荐题。进一步的,所述装置还包括:推荐题筛选模块,用于根据所述相似度生成所述目标题目的推荐题之后,根据用户做题的历史情况和使用要求对所述推荐题进行筛选。进一步的,所述推荐题筛选模块,具体用于根据用户做题的历史情况和使用要求对所述推荐题进行筛选,包括以下至少之一:根据用户做题的历史情况去除预设时间内做过的题目;根据艾宾浩斯记忆曲线去除记忆程度高于预设阈值的题目;根据用户做所述目标题目的对错情况,调整推荐题的难度。第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开任意实施例所述的一种相似题目的推荐方法。第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开任意实施例所述的一种相似题目的推荐方法。本公开实施例通过对目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量;计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度;根据所述相似度生成所述目标题目的推荐题,以提高相似题推荐的准确度。其中,通过将题目转化成知识点向量,通过计算题目知识点向量之间的相似度,来衡量题目的相似度,避免了单纯基于知识点标签和文本之间的距离来寻找相似题目容易出现不准确以本文档来自技高网...

【技术保护点】
1.一种相似题目的推荐方法,其特征在于,包括:对目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量;计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度;根据所述相似度生成所述目标题目的推荐题。

【技术特征摘要】
1.一种相似题目的推荐方法,其特征在于,包括:对目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量;计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度;根据所述相似度生成所述目标题目的推荐题。2.根据权利要求1所述的方法,其特征在于,计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的相似度,包括:计算所述目标题目的概率分布向量与题库中已有题目在各知识点上的概率分布向量之间的距离;相应的,根据所述相似度生成所述目标题目的推荐题,包括:根据所述距离生成所述目标题目的推荐题。3.根据权利要求1所述的方法,其特征在于,对所述目标题目进行知识点分类,得到所述目标题目在各知识点上的概率分布向量,包括:通过神经网络对所述目标题目的题目数据进行处理,得到所述目标题目在各知识点上的概率分布向量,作为第一概率分布;其中,所述题目数据包括文本、公式和/或图片。4.根据权利要求3所述的方法,其特征在于,若所述目标题目带有知识点标签,相应的,得到所述目标题目在各知识点上的概率分布向量之后,还包括:根据所述知识点标签计算所述目标题目在各知识点对应的概率分布向量,作为第二概率分布向量;根据所述第一概率分布向量和所述第二概率分布计算所述目标题目在各知识点上的综合概率分布向量,并将所述综合概率分布向量作为最终的概率分布向量;其中,所述知识点标签用于显示题目所包括的知识点内容。5.根据权利要求1所述的方法,其特征在于,根据所述相似度生成所述目标题目的推荐题之后,包括:对所述推荐题进行去重;其中,所述去重包括:去掉所述推荐题中重复的题目和/或与所述目标题目相同的题目。6.根据权...

【专利技术属性】
技术研发人员:金霄然
申请(专利权)人:上海仁静信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1