基于联合概率矩阵的试卷图像自动核分方法技术

技术编号:21953749 阅读:46 留言:0更新日期:2019-08-24 18:12
本发明专利技术揭示了一种基于联合概率矩阵的试卷图像自动核分方法,包括如下步骤:S1、利用训练手写数据集训练得到分数识别模型;S2、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割;S3、将S2中的结果作为所述分数识别模型的输入,识别并输出可能性最高的N个值;S4、构建联合概率矩阵并创建分数搜索树,计算置信值;S5、对计算结果进行判断、并将计算结果与预设阈值进行比较,最终输出分数计算结果。本发明专利技术通过OCR的技术结合TensFlow及CNN卷积网络的方法,利用联合概率矩阵计算识别置信度,实现了对于试卷总分的自动核对统计。本发明专利技术不仅有效地提高了核分操作的效率,同时也充分地保证了核分结果的准确性。

Automatic Test Paper Image Checking Method Based on Joint Probability Matrix

【技术实现步骤摘要】
基于联合概率矩阵的试卷图像自动核分方法
本专利技术涉及一种基于OCR数字识别技术的自动核分方法,具体涉及一种基于联合概率矩阵的试卷图像自动核分方法,即通过联合概率计算优化每个分数的深度学习识别概率,达到试卷分数有效核验的目的,属于人工智能中的图像识别领域。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)技术是一种通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为计算机可以使用的技术。在对图像进行预处理之后,需要对图像中的目标进行分析,提取出正确代表不同目标物特点的特征参数(图像特征)。对图像进行特征提取后,再对目标进行不同影像的匹配。最后要对图像中目标物进行识别和解释。设计分类器,建立分类模型,对图像中目标物进行识别和分类。随着人工智能的迅速发展,机器学习逐渐成为数字识别的主流方法,2015年9月,Google发布了其第二代人工智能系统TensorFlow,一个开源机器学习软件资源库。它是目前最受欢迎的机器学习算法框架,通过利用Google第二代人工智能平台TensorFlow,使用CNN卷积结合Lenet5神经网络算法实现数字图像的识别。也正是由于上述人工智能系统的出现,为OCR技术的实现提供了有力的技术支持。近年来,也有很多的业内人士开始在实际生活中的诸多方面尝试应用OCR技术。举例而言,在目前对于各类试卷的处理过程中,试卷总分的核对统计通常都需要以人工操作的方式进行。可以预见的,以人工方式核对总分,不仅操作效率低下、而且极易出现失误。因此,如果能将OCR技术应用于试卷核分,那么必将极大地解放学校或机关内的人力资源。综上所述,如何在现有技术的基础上提出一种基于联合概率矩阵的试卷图像自动核分方法,以解决目前人工核对分数导致效率低下、正确率不高的问题,也就成为了本领域内技术人员共同的研究目标。
技术实现思路
鉴于现有技术存在上述缺陷,本专利技术的目的是提出一种基于联合概率矩阵的试卷图像自动核分方法,包括如下步骤:S1、利用训练手写数据集训练得到分数识别模型;S2、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割;S3、将S2中的结果作为所述分数识别模型的输入,识别并输出可能性最高的N个值;S4、构建联合概率矩阵并创建分数搜索树,计算置信值;S5、对计算结果进行判断、并将计算结果与预设阈值进行比较,最终输出分数计算结果。优选地,S1具体包括如下步骤:S11、依据试卷上的分数区域,准备一个满足所有分数的训练手写数据集;S12、使用CNN卷积网络对S11中所述训练手写数据集进行训练,得到分数识别模型。优选地,S2具体包括如下步骤:S21、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割;S22、对所述直线检测算法进行边缘扩展,得到每个大类的得分区域图像。优选地,S2中所述直线检测算法,流程包括:根据每n行中黑色像素点的个数,将大于所述最优阈值的像素行判定为线条,再对线条进行去重优化,随后给每条线条添加一个具有特定阈值的上下滑窗,将每个像素的有效部分进行切割。优选地,S3具体包括如下步骤:将S22中得到的每个所述得分区域图像依次输入S12中得到的所述分数识别模型中,将结果由高到低按序排列,给出识别出的每个得分区域的最高N个可能值及置信度。优选地,S4具体包括如下步骤:S41、使用S3中得到的每个得分区域的最高N个可能值及置信度构建置信度矩阵;S42、构建状态搜索树算法,从S41中得到的置信度矩阵中找到满足小分总和等于总分的组合,并将所有可能状态及联合置信值作为可能结果进行输出,并执行S43;若未找到满足小分总和等于总分的组合,则直接执行S44;S43、对S42中得到的所有可能状态进行置信度排序,并做高斯梯度下降、判别得到最有可能的组合状态,随后执行S44;S44、将S42中得到的可能状态或S43中得到的最有可能的组合状态进行输出。优选地,S42中所述构建状态搜索树算法,具体包括如下步骤:对于过空的根节点,建立起一个搜索树,所述搜索树的第一层结点为第一个数值的结果,在第一层结点下建立第二层结点,所述第二层结点为第二个数值的结果,以此类推,最终建立起一个分数搜索树。优选地,S5具体包括如下步骤:若状态存在则进入后续判断,若状态不存在则输出分数计算错误;在所述后续判断中,将结果与预设阈值进行比较,若结果大于阈值则输出分数计算正确,若结果小于预设阈值则输出分数计算错误。与现有技术相比,本专利技术的优点主要体现在以下几个方面:本专利技术针对目前人工核对分数的情况,提出了一种自动化的核分方法。本专利技术通过OCR的技术结合TensFlow及CNN卷积网络的方法,利用联合概率矩阵计算识别置信度,实现了对于试卷总分的自动核对统计。本专利技术不仅有效地提高了核分操作的效率、缩短了核对分数所需的时间、节约了各高校及机关内的人力资源,同时也充分地保证了核分过程的标准化、提高了核分结果的准确性。同时,本专利技术中对于分数正确与否的计算方法也为同领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸,运用于人工智能领域内的其他相关技术方案中,具有十分广阔的应用前景。以下便结合实施例附图,对本专利技术的具体实施方式作进一步的详述,以使本专利技术技术方案更易于理解、掌握。附图说明图1为本专利技术方法的整体流程示意图。图2为本专利技术方法的局部流程示意图。图3为本专利技术中所构建的分数搜索树的结构示意图。具体实施方式本专利技术针对现有操作中人工核对分数的情况,提出了一种可以通过拍照的方式实现快速大规模试卷核分的方法。该方法通过OpenCv对图片进行切割,然后通过OCR技术进行图片预处理,随后通过TensorFlow+CNN实现数字识别,利用联合概率矩阵计算置信度,替代softmax函数,分析核对总分是否计算正确。具体而言,如图1~图2所示,本专利技术揭示了一种基于联合概率矩阵的试卷图像自动核分方法,包括如下步骤:S1、利用训练手写数据集训练得到分数识别模型。S1具体包括,S11、依据试卷上的分数区域,准备一个满足所有分数的训练手写数据集。S12、使用CNN卷积网络对S11中所述训练手写数据集进行训练,得到分数识别模型。S2、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割。S2具体包括,S21、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割。S22、对所述直线检测算法进行边缘扩展,得到每个大类的得分区域图像。所述直线检测算法,流程包括:根据每n行中黑色像素点的个数,将大于所述最优阈值的像素行判定为线条,再对线条进行去重优化,随后给每条线条添加一个具有特定阈值的上下滑窗,将每个像素的有效部分进行切割。S3、将S2中的结果作为所述分数识别模型的输入,识别并输出可能性最高的N个值。S3具体包括,将S22中得到的每个所述得分区域图像依次输入S12中得到的所述分数识别模型中,将结果由高到低按序排列,给出识别出的每个得分区域的最高N个可能值及置信度。S4、构建联合概率矩阵并创建分数搜索树,计算置信值。S4具体包括,S41、使用S3中得到的每个得分区域的最高N个可能值及置信度构建置信度矩阵。S42、构建状态搜索树算法,从S41中得到的置信度矩阵中找到满足本文档来自技高网
...

【技术保护点】
1.一种基于联合概率矩阵的试卷图像自动核分方法,其特征在于,包括如下步骤:S1、利用训练手写数据集训练得到分数识别模型;S2、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割;S3、将S2中的结果作为所述分数识别模型的输入,识别并输出可能性最高的N个值;S4、构建联合概率矩阵并创建分数搜索树,计算置信值;S5、对计算结果进行判断、并将计算结果与预设阈值进行比较,最终输出分数计算结果。

【技术特征摘要】
1.一种基于联合概率矩阵的试卷图像自动核分方法,其特征在于,包括如下步骤:S1、利用训练手写数据集训练得到分数识别模型;S2、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割;S3、将S2中的结果作为所述分数识别模型的输入,识别并输出可能性最高的N个值;S4、构建联合概率矩阵并创建分数搜索树,计算置信值;S5、对计算结果进行判断、并将计算结果与预设阈值进行比较,最终输出分数计算结果。2.根据权利要求1所述的基于联合概率矩阵的试卷图像自动核分方法,其特征在于,S1具体包括如下步骤:S11、依据试卷上的分数区域,准备一个满足所有分数的训练手写数据集;S12、使用CNN卷积网络对S11中所述训练手写数据集进行训练,得到分数识别模型。3.根据权利要求2所述的基于联合概率矩阵的试卷图像自动核分方法,其特征在于,S2具体包括如下步骤:S21、使用直线检测算法对待检测的试卷分数所在的矩形区域进行切割;S22、对所述直线检测算法进行边缘扩展,得到每个大类的得分区域图像。4.根据权利要求3所述的基于联合概率矩阵的试卷图像自动核分方法,其特征在于,S2中所述直线检测算法,流程包括:根据每n行中黑色像素点的个数,将大于所述最优阈值的像素行判定为线条,再对线条进行去重优化,随后给每条线条添加一个具有特定阈值的上下滑窗,将每个像素的有效部分进行切割。5.根据权利要求3所述的基于联合概率矩阵的试卷图像自动核分方法,其特征在于,S3具体包括如下步骤:将S22中得到的每个所述...

【专利技术属性】
技术研发人员:冯峰李华康符旭宇闫浪迪孔令军孙国梓
申请(专利权)人:南京邮电大学南京邮电大学盐城大数据研究院有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1