【技术实现步骤摘要】
题目识别方法、装置、电子设备及计算机存储介质
本申请实施例涉及计算机
,尤其涉及一种题目识别方法、装置、电子设备及计算机存储介质。
技术介绍
随着在线教育的快速发展,众多教学辅助类产品应运而生。在教学过程中,上述产品可以为老师提供技术支持,减轻老师的工作量,例如:可以实现题目的自动批改、题目搜索等。通过对包含题目的图像进行题目识别,是实现题目批改、题目讲解等的基础。现有技术中在对题目进行题目识别时,利用题目类型识别模型对图像中题目的题型进行区分,将与题型对应的题目用文本框框起来,从而确定题目的题型,然后结合横向文本行检测结果对文本框进行合并,以对题目中的题目内容进行后续处理。然而,在根据题目类型识别模型对题目类型进行识别的方案中,当图像中出现新的题目类型时,需要重新收集新的题目类型相关的训练样本,同时还需要对这些训练样本进行标注,对题目类型识别模型进行重新训练,题目识别效率低下且成本较高。
技术实现思路
有鉴于此,本申请实施例提供一种题目识别方法、装置、电子设备及计算机存储介质,用以克服现有技术中存在的题目识别效率低且成本高的缺陷。第一方面,本申请实施例提供了一种题目识别方法,所述方法包括:获取包含题目的目标图像;将所述目标图像输入预先训练完成的检测模型,得到所述题目的题目区域和所述题目中的文本区域;通过预先训练完成的编码器模型,对所述题目区域的图像部分进行编码,获得所述题目的编码向量,基于所述编码向量与预存的多种题目类型特征向量的匹配结果,获得所述题目的题目类型信息 ...
【技术保护点】
1.一种题目识别方法,其特征在于,所述方法包括:/n获取包含题目的目标图像;/n将所述目标图像输入预先训练完成的检测模型,得到所述题目的题目区域和所述题目中的文本区域;/n通过预先训练完成的编码器模型,对所述题目区域的图像部分进行编码,获得所述题目的编码向量,基于所述编码向量与预存的多种题目类型特征向量的匹配结果,获得所述题目的题目类型信息;/n基于所述题目中的文本区域进行文本识别,得到文本识别结果;/n根据所述题目类型信息和所述文本识别结果,进行题目构建,获得与所述目标图像中的题目对应的构建题目。/n
【技术特征摘要】
1.一种题目识别方法,其特征在于,所述方法包括:
获取包含题目的目标图像;
将所述目标图像输入预先训练完成的检测模型,得到所述题目的题目区域和所述题目中的文本区域;
通过预先训练完成的编码器模型,对所述题目区域的图像部分进行编码,获得所述题目的编码向量,基于所述编码向量与预存的多种题目类型特征向量的匹配结果,获得所述题目的题目类型信息;
基于所述题目中的文本区域进行文本识别,得到文本识别结果;
根据所述题目类型信息和所述文本识别结果,进行题目构建,获得与所述目标图像中的题目对应的构建题目。
2.根据权利要求1所述的方法,其特征在于,所述通过预先训练完成的编码器模型,对所述题目区域的图像部分进行编码,获得所述题目的编码向量,包括:
根据所述题目区域,对所述目标图像进行截图,获得题目区域的图像部分;
将所述题目区域的图像部分输入所述预先训练完成的编码器模型,得到所述题目的编码向量。
3.根据权利要求1所述的方法,其特征在于,基于所述题目的编码向量与预存的多种题目类型特征向量的匹配结果,获得所述题目的题目类型信息,包括:
计算所述题目的编码向量与所述预存的多种题目类型特征向量之间的题目相似度,得到该题目区域对应的多个题目相似度;
若所述多个题目相似度中包括大于预设相似度的题目相似度,则将所述多个题目相似度中最大题目相似度对应的题目类型特征向量的题目类型信息,确定为所述题目的题目类型信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若多个题目相似度均小于或等于预设相似度,则将所述题目的编码向量加入所述预存的多种题目类型特征向量中。
5.根据权利要求1所述的方法,其特征在于,所述编码器模型通过以下方式进行预先训练:
获取包含样本题目的第一训练图像样本,所述第一训练图像样本中的样本题目属于同一题目类型;
将所述第一训练图像样本输入初始编码器模型,得到所述样本题目的题目预测编码向量;
将所述样本题目的题目预测编码向量输入初始解码器模型,得到所述样本预测题目;
根据所述样本预测题目,采用L1损失函数,获得第一损失值;
根据所述第一损失值,对所述初始编码器模型和所述初始解码器模型进行训练,得到所述编码器模型。
6.根据权利要求5所述的方法,其特征在于,所述获取包含样本题目的第一训练图像样本,包括:
获取训练图像样本集,其中,所述训练图像样本集中的图像样本为对应于多个不同题目类型的图像样本;
从多个不同题目类型中确定一个题目类型,并将该题目类型对应的图像样本确定为所述第一训练图像样本。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
将所述第一训练图像样本输入所述预先训练完成的编码器模型,得到所述第一训练图像样本对应的编码向量;
计算所述第一训练图像样本对应的编码向量的平均值;
将所述编码向量的平均值作为所述第一训练图像样本的题目类型特征向量;
根据所述第一训练图像样本的题目类型特征向量确定所述预存的多种题目类型特征向量。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述编码器模型为变分自编码器模型。
9.根据权利要求1所述的方法,其特征在于,将所述目标图像输入预先训练完成的检测模型,得到所述题目的题目区域和所述题目中的文本区域,包括:
将所述目标图像输入预先训练完成的检测模型,通过所述检测模型的第一检测分支得到所述题目的题目区域;通过所述检测模型的第二检测分支得到所述题目中的打印体文本的文本区域;通过所述检测模型的第三检测分支得到所述题目中的手写体文本的文本区域,所述题目中的文本区域包括所述题目中的打印体文本的文本区域和所述题目中的手写体文本的文本区域;
基于所述题目中的文本区域进行文本识别,得到文本识别结果,包括:
通过预先训练完成的识别模型,基于所述打印体文本的文本区域以及所述手写体文本的文本区域,分别进行文本识别,得到对应的打印体文本识别结果和手写体文本识别结果;
其中,所述编码器模型和所述识别模型为并行执行的两个模型。
10.根据权利要求9所述的方法,其特征在于,所述通过预先训练完成的识别模型,基于所述打印体文本的文本区域以及所述手写体文本的文本区域,分别进行文本识别,得到对应的打印体文本识别结果和手写体文本识别结果,包括:
分别根据所述打印体文本的文本区域以及所述手写体文本的文本区域,对所述目标图像进行截图,获得对应的打印体文本区域图像和手写体文本区域图像;
分别将所述打印体文本区域图像和所述手写体文本区域图像输入所述预先训练完成的识别模型,进行文本识别,得...
【专利技术属性】
技术研发人员:秦勇,杨家博,
申请(专利权)人:北京世纪好未来教育科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。