【技术实现步骤摘要】
一种自适应答题纸序列纠正方法
本专利技术涉及智能阅卷
,尤其涉及一种自适应答题纸序列纠正方法。
技术介绍
目前的智能阅卷系统在收集好学生的答题纸后,通过扫描仪将答题纸进行正反面的扫描并存储下来,交由后续系统进行自动批改。但是扫描仪扫描的过程中,会出现正反面不匹配的现象,具体地,扫描仪扫描完成后得到的答题纸序列中,存在A面B面并非来自同一个学生的情况,可能需要在其前后的扫描结果中才能找到相应匹配的另一面。这种扫描顺序出错是由于扫描仪在遇到大量的扫描任务时,图片存储的过程和扫描过程产生的时序上的交错,最终导致顺序的错乱。目前解决该问题的方法大多是通过人工核实并给予纠正,但是当答题纸数量庞大时,就需要消耗大量的人工资源,而且人工在长时间的纠正的过程中,会出现视觉的疲劳,严重降低人工纠正的效率,且无法保证准确性。
技术实现思路
有鉴于此,本说明书一个或多个实施例的目的在于提出一种自适应答题纸序列纠正方法,能够实现答题纸的自动匹配,以解决人工匹配效率低下且无法保证准确性的问题。基于上述 ...
【技术保护点】
1.一种自适应答题纸序列纠正方法,其特征在于,包括:/n获取学生答题纸的A面扫描图像、B面扫描图像以及原始图像序列;/n将所述A面扫描图像及B面扫描图像分别进行分割,获得包含学生字迹的A面图像块和B面图像块;/n将所述的A面图像块和B面图像块输入预训练好的字迹匹配模型中,获得原始图像序列下相邻的A面扫描图像与B面扫描图像的匹配结果;/n将所述匹配结果中未匹配成功的A面扫描图像与B面扫描图像输入到预训练好的字迹搜索模型中,为每一个A面扫描图像搜索到与之相匹配的B面扫描图像。/n
【技术特征摘要】
1.一种自适应答题纸序列纠正方法,其特征在于,包括:
获取学生答题纸的A面扫描图像、B面扫描图像以及原始图像序列;
将所述A面扫描图像及B面扫描图像分别进行分割,获得包含学生字迹的A面图像块和B面图像块;
将所述的A面图像块和B面图像块输入预训练好的字迹匹配模型中,获得原始图像序列下相邻的A面扫描图像与B面扫描图像的匹配结果;
将所述匹配结果中未匹配成功的A面扫描图像与B面扫描图像输入到预训练好的字迹搜索模型中,为每一个A面扫描图像搜索到与之相匹配的B面扫描图像。
2.根据权利要求1所述的自适应答题纸序列纠正方法,其特征在于,所述将所述A面扫描图像及B面扫描图像分别进行分割,获得包含学生字迹的A面图像块和B面图像块,包括
将所述A面扫描图像或B面扫描图像输入至预训练好的目标检测模型中,获取字迹敏感区域坐标;
根据所述字迹敏感区域坐标,剪裁得到字迹集中区域;
基于横向像素统计的方法,对所述字迹集中区域按行进行分割,得到包含字迹的行数据图像;
对所述行数据图像进行轮廓检测,得到字迹在所述行数据图像中的起始坐标以及终止坐标;
根据所述行数据图像中的起始坐标以及终止坐标,去除所述行数据图像中头和尾的空白区域;
将去除头和尾的空白区域的行数据图像纵向分割,获得包含学生字迹的A面图像块或B面图像块。
3.根据权利要求2所述的自适应答题纸序列纠正方法,其特征在于,所述目标检测模型为Yolov3模型;
所述目标检测模型的训练方法为:
将预先标记好字迹敏感区域坐标的答题纸扫描图像输入Yolov3模型进行迭代运算,直至达到预设的迭代次数;
获得训练好的Yolov3模型。
4.根据权利要求1所述的自适应答题纸序列纠正方法,其特征在于,所述字迹匹配模型的训练过程为:
获取多组训练数据对,每组所述训练数据对包括两个训练图像块以及标识两个训练图像块是否相似的相似标签;
针对每组训练数据对,将组内的两个训练图像块分别输入特征提取网络模型中,进行卷积运算,获得与两个所述训练图像块对应的训练低维空间特征向量;
计算组内的两个训练低维空间特征向量之间的欧式距离,所述欧式距离表征组内的两个训练图像块之间的相似度距离;
将所述欧式距离以及所述相似标签带入损失函数,计算损失值;
根据全部的损失值计算平均损失值;
判断当前平均损失值与前一次平均损失值的差值是否低于收敛阈值;
若当前平均损失值与前一次平均损失值的差值低于收敛阈值,则由当前平均损失值对应的相似度距离计算相似度阈值,获得训练好的字迹匹配模型;若当前平均损失值与前一次平均损失值的差值高于收敛阈值,则更新特征提取网络模型的参数,返回执行计算训练低维空间特征向量的步骤。
5.根据权利要求4所述的自适应答题纸序列纠正方法,其特征在于,所述更新特征提取网络模型的参数,包括
采用梯度下降法对所述损失函数求偏导,进行反向传导,对所述特征提取网络模型的参数进行调整更新。
6.根据权利要求4所述的自适应答题纸序列纠正方法,其特征在于,所述由当前平均损失值对应的相似度距离计算相似度阈值,包括
由当前平均损失值对应的相似度距离计算平均相似度距离;
所述相似度阈值等于所述平均相似度距离。
7.根据权利要求4所述的自适应答题纸序列纠正方法,其特征在于,所述将所述的A面图像块和B面图像块输入预...
【专利技术属性】
技术研发人员:傅慧源,马华东,田杨峰,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。