一种语文试卷版面分析方法及系统技术方案

技术编号:26172695 阅读:38 留言:0更新日期:2020-10-31 13:51
本发明专利技术公开了一种语文试卷版面分析方法及系统,所述方法包括:数据集的构建;其中,所述数据集包括多种语文试卷或文献中的试卷图像;对所述数据集中的试卷图像进行图像预处理;基于已训练的深度学习网络对预处理后的图像进行图像识别分析,以得到识别结果进而实现题目和答案的匹配;其中,所述识别结果包括题目内容的识别与定位以及各题目对应的答案定位和答案提取;其效果是:通过图像处理和深度学习网络的应用,对语文试卷中的题目内容进行识别,并根据不同的题目实现对应的题目和答案的匹配,很好的解决了语文试卷分析的需求,为后续有效的提高语文试卷的自动化批改效率打下了基础。

【技术实现步骤摘要】
一种语文试卷版面分析方法及系统
本专利技术涉及试卷的图像处理
,具体涉及一种语文试卷版面分析方法及系统。
技术介绍
随着人工智能的兴起,在教育行业也大有作为,其中教师或教学人员在试卷批改上需要投入大量的时间,因此,智能化的自动批改已成为教育行业极具前景和市场的方向。版面分析是智能化自动批改的基础,也是重要和必不可少的前期工作,语文的版面分析具有其自身的复杂特征,例如,其中基本不含有公式,可能含有特有的作文题等。而现有技术中,采用通用的分割框架和数据集不能很好的解决语文试卷分析的需求。
技术实现思路
本专利技术实施例的目的是提供一种语文试卷版面分析方法及系统,以解决现有技术中,不能很好的解决语文试卷分析需求的缺陷。第一方面:一种语文试卷版面分析方法,所述方法包括:数据集的构建;其中,所述数据集包括多种语文试卷或文献中的试卷图像;对所述数据集中的试卷图像进行图像预处理;基于已训练的深度学习网络对预处理后的图像进行图像识别分析,以得到识别结果进而实现题目和答案的匹配;其中,所述识别结果包括题目内容的识别与定位以及各题目对应的答案定位和答案提取。作为本专利技术的一个优选的技术方案,所述预处理具体包括:所述试卷图像的矫正;所述试卷图像的降噪处理;所述试卷图像的质量增强处理。作为本专利技术的一个优选的技术方案,所述深度学习网络包括实例分割网络和检测网络;当以检测网络的anchorbox形式来定位和检测答案时:若所述题目采用所述实例分割网络生成题目模板mask时,题目和答案的匹配是mask与答案anchorbox之间的坐标匹配;若题目采用所述检测网络生成预选框anchorbox时,题目和答案的匹配是题目anchorbox与答案anchorbox之间的坐标匹配;当以实例分割网络的mask形式来定位和检测答案时:若所述题目采用所述实例分割网络生成题目模板mask时,题目和答案的匹配是mask与答案mask之间的坐标匹配;若题目采用所述检测网络生成预选框anchorbox时,题目和答案的匹配是题目anchorbox与答案mask之间的坐标匹配。作为本专利技术的一个优选的技术方案,所述mask与anchorbox之间的坐标匹配,具体包括:计算mask的外接矩形,同样转化为两个anchorbox的匹配方式;或者,计算anchorbox中哪些像素点落入mask内,从而统计出mask与anchorbox的交集。作为本专利技术的一个优选的技术方案,所述题目anchorbox与答案anchorbox之间的坐标匹配,具体包括:计算IoU,即两个anchorbox之间的交并比;或者,只计算两个anchorbox的交集与其中一个较小anchorbox的比值。第二方面:一种语文试卷版面分析系统,包括:数据库,用于数据集的构建;其中,所述数据集包括多种语文试卷或文献中的试卷图像;预处理单元,用于对所述数据集中的试卷图像进行图像预处理;分析单元,用于基于已训练的深度学习网络对预处理后的图像进行图像识别分析,以得到识别结果进而实现题目和答案的匹配;其中,所述识别结果包括题目内容的识别与定位以及各题目对应的答案定位和答案提取。作为本专利技术的一个优选的技术方案,所述预处理具体包括:所述试卷图像的矫正;所述试卷图像的降噪处理;所述试卷图像的质量增强处理。作为本专利技术的一个优选的技术方案,所述深度学习网络包括实例分割网络和检测网络;当以检测网络的anchorbox形式来定位和检测答案时:若所述题目采用所述实例分割网络生成题目模板mask时,题目和答案的匹配是mask与答案anchorbox之间的坐标匹配;若题目采用所述检测网络生成预选框anchorbox时,题目和答案的匹配是题目anchorbox与答案anchorbox之间的坐标匹配;当以实例分割网络的mask形式来定位和检测答案时:若所述题目采用所述实例分割网络生成题目模板mask时,题目和答案的匹配是mask与答案mask之间的坐标匹配;若题目采用所述检测网络生成预选框anchorbox时,题目和答案的匹配是题目anchorbox与答案mask之间的坐标匹配。作为本专利技术的一个优选的技术方案,所述mask与anchorbox之间的坐标匹配,具体包括:计算mask的外接矩形,同样转化为两个anchorbox的匹配方式;或者,计算anchorbox中哪些像素点落入mask内,从而统计出mask与anchorbox的交集。作为本专利技术的一个优选的技术方案,所述题目anchorbox与答案anchorbox之间的坐标匹配,具体包括:计算IoU,即两个anchorbox之间的交并比;或者,只计算两个anchorbox的交集与其中一个较小anchorbox的比值。采用上述技术方案,具有以下优点:本专利技术提出的一种语文试卷版面分析方法及系统,通过图像处理和深度学习网络的应用,对语文试卷中的题目内容进行识别,并根据不同的题目实现对应的题目和答案的匹配,很好的解决了语文试卷分析的需求,为后续有效的提高语文试卷的自动化批改效率打下了基础。附图说明图1为本专利技术实施例提供的一种语文试卷版面分析方法的流程图;图2为本专利技术实施例提供的一种深度学习网络的结构示意图;图3为本专利技术实施例中提供的一种作文题目的示意图;图4为本专利技术实施例中提供的一种分析结果示例图;图5为本专利技术实施例提供的一种语文试卷版面分析系统的结构框图。具体实施方式为了使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述,以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。参照图1所示,一种语文试卷版面分析方法,所述方法包括:S101,数据集的构建;其中,所述数据集包括多种语文试卷或文献中的试卷图像。具体地,所述数据集为提供语文试卷的试卷图像集合,其中还包括针对语文试卷的标签设定,所述标签包括题目标签和答案标签;题目标签包括标题、选择题、填空题和作文题等(作文题中可能包含了答案,参照图3所示);答案标签包括选择题答案、填空题答案和作文题答案等。S102,对所述数据集中的试卷图像进行图像预处理。具体地,所述预处理具体包括:所述试卷图像的矫正;例如,采用仿射透射变换和去畸变等方式;所述试卷图像的降噪处理;所述试卷图像的质量增强处理。这样处理,是因为原始输入的图像质量会影响后续算法的效果,因此,预处理后,使后续的算法处理的效果更优。S103,基于已训练的深度学习网络对预处理后的图像进行图像识别分析,以得到识别结果进而实现题目和答案的匹配;其中,所述识别结果包括题目内容的识别与定位以本文档来自技高网...

【技术保护点】
1.一种语文试卷版面分析方法,其特征在于,所述方法包括:/n数据集的构建;其中,所述数据集包括多种语文试卷或文献中的试卷图像;/n对所述数据集中的试卷图像进行图像预处理;/n基于已训练的深度学习网络对预处理后的图像进行图像识别分析,以得到识别结果进而实现题目和答案的匹配;其中,所述识别结果包括题目内容的识别与定位以及各题目对应的答案定位和答案提取。/n

【技术特征摘要】
1.一种语文试卷版面分析方法,其特征在于,所述方法包括:
数据集的构建;其中,所述数据集包括多种语文试卷或文献中的试卷图像;
对所述数据集中的试卷图像进行图像预处理;
基于已训练的深度学习网络对预处理后的图像进行图像识别分析,以得到识别结果进而实现题目和答案的匹配;其中,所述识别结果包括题目内容的识别与定位以及各题目对应的答案定位和答案提取。


2.根据权利要求1所述的一种语文试卷版面分析方法,其特征在于,所述预处理具体包括:
所述试卷图像的矫正;
所述试卷图像的降噪处理;
所述试卷图像的质量增强处理。


3.根据权利要求1所述的一种语文试卷版面分析方法,其特征在于,所述深度学习网络包括实例分割网络和检测网络;
当以检测网络的anchorbox形式来定位和检测答案时:
若所述题目采用所述实例分割网络生成题目模板mask时,题目和答案的匹配是mask与答案anchorbox之间的坐标匹配;
若题目采用所述检测网络生成预选框anchorbox时,题目和答案的匹配是题目anchorbox与答案anchorbox之间的坐标匹配;
当以实例分割网络的mask形式来定位和检测答案时:
若所述题目采用所述实例分割网络生成题目模板mask时,题目和答案的匹配是mask与答案mask之间的坐标匹配;
若题目采用所述检测网络生成预选框anchorbox时,题目和答案的匹配是题目anchorbox与答案mask之间的坐标匹配。


4.根据权利要求3所述的一种语文试卷版面分析方法,其特征在于,所述mask与anchorbox之间的坐标匹配,具体包括:
计算mask的外接矩形,同样转化为两个anchorbox的匹配方式;
或者,计算anchorbox中哪些像素点落入mask内,从而统计出mask与anchorbox的交集。


5.根据权利要求3所述的一种语文试卷版面分析方法,其特征在于,所述题目anchorbox与答案anchorbox之间的坐标匹配,具体包括:
计算IoU,即两个anchorbox之间的交并比;
或者,只计算两个anchorbox的交集与其中一个较小anchorbox的比值。


6.一...

【专利技术属性】
技术研发人员:周鸿姚璐
申请(专利权)人:上海掌学教育科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1