【技术实现步骤摘要】
基于图像检测的试题检查方法及相关设备
本专利技术涉及图像处理领域,具体涉及一种基于图像检测的试题检查方法、装置、电子设备及计算机可读存储介质。
技术介绍
现有的技术仅仅只能对填图的答题卡进行自动阅卷,对于主观题仅仅只会扫描,某些考生书写比较差,但是存在大量的考生虽然书写较差但是答题过程答题逻辑完全正确。因此这时候阅卷老师就不得不仔细看试卷,在阅卷期间阅卷工作量大,阅卷任务重。此外,对于现有的数学、物理试卷的填空问答题需要进行人工批阅,通常问答题都是固定答案,而简答题及主观计算题又都是公式,因而,基于传统的自然语言处理(NaturalLanguageProcessing,NLP)无法解决公式推理问题。此外,试题中的公式存在上标下标,传统的文字识别算法并未对公式识别有好的识别率,很大概率会被认为连续写的字而不被认为是上下标,因而造成阅卷效率低下。
技术实现思路
鉴于以上内容,有必要提出一种基于图像检测的试题检查方法、装置、电子设备及计算机可读存储介质以提高阅卷效率。本申请的第一方面提供一种基于图像检测 ...
【技术保护点】
1.一种基于图像检测的试题检查方法,其特征在于,所述方法包括:/n获取包含有答题卡的图像;/n对所述图像中的文字进行识别,得到文字识别文本;/n将所述图像中的公式按照连通域进行分割,将获得的字符部件序列中的字符部件两两组合为字符部件对,并使用SVM分类器将字符部件对分类,再根据分类结果将属于同一字符的字符部件组合,获得若干字符;/n利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别,获得字符的类别和字符的位置关系,对于无法识别的字符看作粘连字符,对粘连字符进行分割操作后再进行字符识别操作;/n根据字符的类别和位置关系对字符的组合进行几何和语义约束,再结合CYK算 ...
【技术特征摘要】
1.一种基于图像检测的试题检查方法,其特征在于,所述方法包括:
获取包含有答题卡的图像;
对所述图像中的文字进行识别,得到文字识别文本;
将所述图像中的公式按照连通域进行分割,将获得的字符部件序列中的字符部件两两组合为字符部件对,并使用SVM分类器将字符部件对分类,再根据分类结果将属于同一字符的字符部件组合,获得若干字符;
利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别,获得字符的类别和字符的位置关系,对于无法识别的字符看作粘连字符,对粘连字符进行分割操作后再进行字符识别操作;
根据字符的类别和位置关系对字符的组合进行几何和语义约束,再结合CYK算法自下而上的完成公式的重构,得到公式识别文本;及
建立标准答案库,利用评分深度神经网络进行标准答案学习,及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。
2.如权利要求1所述的基于图像检测的试题检查方法,其特征在于,所述对所述图像中的文字进行识别得到文字识别文本包括:
对所述图像进行预处理;
对预处理后的图像进行分析得到多个候选文本区域;及
将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中,并将候选文本区域中的内容转换为文字识别文本。
3.如权利要求1所述的基于图像检测的试题检查方法,其特征在于,所述对所述图像进行预处理包括:
对所述图像进行锐化、灰度化、二值化、矫正倾斜、降噪等处理。
4.如权利要求2所述的基于图像检测的试题检查方法,其特征在于,所述将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中,并将候选文本区域中的内容转换为文字识别文本包括:
利用全深度卷积神经网络对每个候选文本区域进行文本图像特征提取,把每个候选文本区域表示成特征向量;
采用双层循环神经网络对所述特征向量进行处理,并输出关于字符集的概率分布;及
采用CTC网络作为转录层,将所述关于字符集的概率分布使用前向计算和反向梯度传播的动态规划算法,输出所述文字识别文本。
5.如权利要求1所述的基于图像检测的试题检查方法,其特征在于,所述对所述图像中的文字进行识别得到文字识别文本包括:
将包含有答题卡的图像输入预先训练的深度神经网络中,确定所述图像中的字符区域对应的特征图;及
通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别,得到所述图像中包含的字符。
6.如权利要求5所述的基于图像检测的试题检查方法,其特征在于,所述特征图中的字符数据的类别包括:第一字符类别、第二字符类...
【专利技术属性】
技术研发人员:盛建达,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。