一种题目搜索、批改方法、装置、电子设备和存储介质制造方法及图纸

技术编号:20221677 阅读:84 留言:0更新日期:2019-01-28 20:13
本发明专利技术提供了一种题目搜索、批改方法、装置、电子设备和存储介质,包括:对待搜索试卷的影像进行检测,检测出待搜索试卷上各个待搜索题目的区域,识别出各个待搜索题目区域中题干的文字内容;将每一待搜索题目题干的文字内容输入题干向量化模型,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量;针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目;汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与待搜索试卷匹配的试卷。应用本发明专利技术提供的方案可以提高搜索速度和准确度。

【技术实现步骤摘要】
一种题目搜索、批改方法、装置、电子设备和存储介质
本专利技术涉及人工智能
,尤其涉及一种题目搜索、批改方法、装置、电子设备和计算机可读存储介质。
技术介绍
随着计算机技术和教育信息化的不断推进,计算机技术已经逐步应用于日常的教育教学各项活动中,例如在教学评测场景下得到了相应的应用。国内现有的基础教育、学生学习状况的主要考察形式仍是各种类型的考试或测试,在此状况下,教师背负着很大的批改试卷的工作压力。目前,智能终端类产品有许多解决批改作业和试卷的搜题APP,将包含待批改试卷的影像输入搜题APP,以便搜题APP根据试卷的影像内容从题库中搜索到与试卷的影像中的各个题目相对应的题目。现有的题目搜索方法在进行题目搜索时,是根据各个题目的题干的文字内容在题库中进行查找,然而,这种搜索方式效率低,而且很容易出错,有部分文字内容不同就无法查找到对应的题目。
技术实现思路
本专利技术的目的在于提供一种题目搜索方法、批改、装置、电子设备和计算机可读存储介质,以解决现有的题目搜索方式效率低,容易出错的问题。为达到上述目的,本专利技术提供了一种题目搜索方法,所述方法包括:步骤S11:对待搜索试卷的影像进行本文档来自技高网...

【技术保护点】
1.一种题目搜索方法,其特征在于,所述方法包括:步骤S11:对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,并识别出各个待搜索题目的区域中题干的文字内容;步骤S12:将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量,其中,所述题干向量化模型是基于神经网络的模型;步骤S13:针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目;步骤S14:汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足...

【技术特征摘要】
1.一种题目搜索方法,其特征在于,所述方法包括:步骤S11:对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,并识别出各个待搜索题目的区域中题干的文字内容;步骤S12:将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量,其中,所述题干向量化模型是基于神经网络的模型;步骤S13:针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目;步骤S14:汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷,通过所述目标试卷完成对所述待搜索试卷上的待搜索题目的搜索。2.如权利要求1所述的题目搜索方法,其特征在于,所述题干向量化模型通过以下步骤训练得到:对第一题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中题干的文字内容;利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取,从而训练得到所述题干向量化模型。3.如权利要求1所述的题目搜索方法,其特征在于,在所述待搜索试卷中的待搜索题目包含图片的情况下,所述方法还包括:步骤S15:在步骤S11检测出所述待搜索试卷上的各个待搜索题目的区域之后,将包含图片的待搜索题目中的图片输入预先训练的图片向量化模型中,得到包含图片的待搜索题目的图片的特征向量,其中,所述图片向量化模型是基于神经网络的模型;步骤S16:在步骤S12得到每一待搜索题目的题干的特征向量之后,对于不包含图片的待搜索题目,直接将该待搜索题目的题干的特征向量作为该待搜索题目的特征向量,对于包含图片的待搜索题目,将该待搜索题目的图片的特征向量与题干的特征向量进行拼接,作为该待搜索题目的特征向量。4.如权利要求3所述的题目搜索方法,其特征在于,所述图片向量化模型通过以下步骤训练得到:对第二题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中的图片;利用神经网络模型对每个题目样本中的图片进行二维特征向量提取,从而训练得到所述图片向量化模型。5.如权利要求1所述的题目搜索方法,其特征在于,预先对题库中试卷上的各个题目的特征向量建立索引信息表;步骤S13进一步包括:针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量;将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。6.如权利要求5所述的题目搜索方法,其特征在于,在建立所述索引信息表之前,将不同长度的特征向量按照长度进行分组;所述针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量,包括:针对每一待搜索题目,在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内,查找与该待搜索题目的特征向量相匹配的特征向量。7.如权利要求1所述的题目搜索方法,其特征在于,所述将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷,包括:将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。8.如权利要求7所述的题目搜索方法,其特征在于,所述通过所述目标试卷完成对所述待搜索试卷上的待搜索题目的搜索,包括:在所述待搜索试卷中某一待搜索题目的最接近题目属于所述目标试卷时,将该某一待搜索题目的最接近题目确定为该某一待搜索题目的搜索结果;在所述待搜索试卷中某一待搜索题目的最接近题目不属于所述目标试卷时,将该某一待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配,找到所述目标试卷中最短编辑距离最小的题目作为目标题目,若所述最小的最短编辑距离小于第二预设阈值,则将该某一待搜索题目的搜索结果修正为所述目标题目。9.如权利要求1所述的题目搜索方法,其特征在于,所述对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,包括:利用预先训练好的检测模型对所述待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,其中,所述检测模型是基于神经网...

【专利技术属性】
技术研发人员:何涛罗欢陈明权
申请(专利权)人:杭州大拿科技股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1