一种基于图像识别的作业错题收集系统技术方案

技术编号:36987265 阅读:13 留言:0更新日期:2023-03-25 18:05
本发明专利技术涉及图像数据处理领域,尤其涉及一种基于图像识别的作业错题收集系统,本发明专利技术设置数据库模块、数据获取模块、数据处理模块以及数据校对模块,获取用户端上传的图片信息,并基于图片信息识别图片中答案对应的文本轮廓,将文本轮廓与数据库中存储的轮廓图案进行对比,确定文本轮廓对应的文字,在文本轮廓与轮廓图案的重合度较低时,考虑相邻文本轮廓的文字的关联文字,在调整重合度对比阈值后,重新获取文本轮廓与关联文字对应的轮廓图案的重合度对比结果,进而提高对文本轮廓对应的文字的识别率。字的识别率。字的识别率。

【技术实现步骤摘要】
一种基于图像识别的作业错题收集系统


[0001]本专利技术涉及图像数据处理领域,尤其涉及一种基于图像识别的作业错题收集系统。

技术介绍

[0002]随着图像识别技术的不断进步,其相关技术被应用于各类领域,尤其是在办公、教育领域,例如文件扫描、文件识别、作业批改等;中国专利公开号:CN111242045A,公开了一种自动化作业习题对错指示方法及系统,该方法为:采集彩色参考线框内的等待批改的作业本或者试卷纸张的待判定图像;将该待判定图像与标准习题集对比找出匹配度最高的标准习题图像;每个标准习题图像中均包含每个小题答题块的标准答案文字、位置和大小;获取该待判定图像中每个小题答题块的小题答题子图像,并且通过标准函数从小题答题子图像中识别答题文字,并与标准习题图像中相应的小题答题块的标准答案文字进行对比,确定该待判定图像中每个小题答题块的答题对错;根据待判定图像中每个小题答题块的对错在对应作业本或者试卷纸张上的对应位置投影输出彩色对号或错号。该专利技术能够实现自动化、高速的答题对错指示。
[0003]但是现有技术中还存在以下问题,现有技术中,在文字的轮廓图案不清晰或不易识别的状况下未考虑根据相邻文字分析未识别文字的词组构成进而提高文字的识别率。

技术实现思路

[0004]为解决现有技术中对于文本识别精度不高的问题,本专利技术提供一种基于图像识别的作业错题收集系统,其包括:数据库模块,其包括用以存储各文字之间的关联关系的第一存储单元以及用以存储若干文字轮廓的第二存储单元,各所述文字轮廓与文字间预建立有对应关系;数据获取模块,其与用户端连接,用以接收用户端发送的图片信息;数据处理模块,其包括第一数据对比单元、第二数据对比单元、第一解析单元以及第二解析单元,所述第一数据对比单元与所述数据获取模块相连接,用以接收所述图片信息并提取图片信息中答案的文字轮廓,并基于各所述文字轮廓的清晰度参量对各所述文字轮廓进行筛选;所述第二数据对比单元与所述第一数据对比单元以及数据库模块分别连接,用以计算所述第一数据对比单元筛选出的文字轮廓与所述数据库模块中存储的各轮廓图案的重合度,并将各所述重合度与重合度对比阈值或重合度修正对比阈值进行对比,以获取所述文字轮廓与各所述轮廓图案的重合度对比结果;所述第一解析单元与所述第二数据对比单元以及数据库模块分别连接用以在第一重合度对比结果下,基于文字轮廓与各轮廓图案的重合度排序确定所述文字轮廓所对应
的文字,并根据已确定的所有文字生成文本信息;所述第二解析单元与所述第二数据对比单元以及数据库模块分别连接,用以在第二重合度对比结果下,确定所述文字轮廓的相邻文字轮廓所对应的文字,并确定各所述文字的关联文字对应的轮廓图案,并将各所述轮廓图案发送至第二数据对比单元,以使所述第二数据对比单元修正所述重合度对比阈值后重新获取所述文字轮廓与已接收轮廓图案的重合度对比结果;校对模块,其与所述第一解析单元连接,用以将所述第一解析单元生成的文本信息与预设对照答案信息进行对比并判定所述文本信息是否错误。
[0005]进一步地,所述第一重合度对比结果为所述文字轮廓与至少一个轮廓图案的重合度大于等于所述重合度对比阈值或重合度修正对比阈值;所述第二重合度对比结果为所述文字轮廓与全部轮廓图案的重合度均小于所述重合度对比阈值或重合度修正对比阈值。
[0006]进一步地,所述第一数据对比单元按照公式(1)计算各文字轮廓对应的清晰度参量D,(1)公式(1)中,S表示文字轮廓的面积,S0表示各文字轮廓的平均面积值,C表示文字轮廓的色度值,C0表示各文字轮廓的平均色度值。
[0007]进一步地,所述第一数据对比单元将文字轮廓对应的文字清晰参量D与预设清晰度对比参量D1进行对比,并根据对比结果将文字轮廓筛选出,其中,若对比结果满足第一预设条件,所述第一数据对比单元判定将所述文字轮廓筛选出;所述第一预设条件为D≥D1。
[0008]进一步地,所述第一解析单元在第一重合度对比结果下,将文字轮廓与各轮廓图案的重合度进行排序,在排序结果中,将重合度最高的轮廓图案对应文字作为所述文字轮廓对应的文字。
[0009]进一步地,所述第二解析单元获取所述文字轮廓的相邻文字轮廓的重合度判定结果,若任一所述相邻文字轮廓符合第一重合度对比结果,则所述第二解析单元获取所述第一解析单元所判定的所述相邻文字轮廓所对应的文字,并基于第一存储单元中存储的各文字之间的关联关系确定与所获取文字存在关联关系的关联文字,以记录生成关联文字集;若所述相邻文字轮廓均符合第二重合度对比结果,则所述第二解析单元判定无法识别所述文字轮廓所对应的文字。
[0010]进一步地,所述第一存储单元构建各文字之间的关联关系,其中,所述第一存储单元内存储有若干词汇,并确定构成各词汇的文字,对于任意词汇,将构成所述词汇的各文字建立关联关系。
[0011]进一步地,所述第二数据对比单元按照公式(2)计算离散参量E,
(2)公式(2)中,G(i)表示所述关联文字集中第i个关联文字对应的轮廓图案与剩余文字对应的轮廓图案重合度的平均值,n表示关联文字集中的文字数量,n为大于零的整数。
[0012]进一步地,所述第二数据对比单元接收所述关联文字集,并确定所述关联文字集中的各关联文字对应的轮廓图案,所述第二数据对比单元获取所述文字轮廓与各所述轮廓图案的重合度对比结果时,将所述离散参量E与离散参量对比参数E0进行对比,根据对比结果对所述重合度对比阈值H0进行修正,其中,第一修正方式为根据第一预设修正参量h1将所述重合度对比阈值H0修正至重合度修正对比阈值H,设定H=H0

h1;第二修正方式为根据第二预设修正参量h2将所述重合度对比阈值H0修正至重合度修正对比阈值H,设定H=H0

h2;其中,h1<h2,第一修正方式需满足E<E0,第二修正方式需满足E≥E0。
[0013]进一步地,所述预设对照答案信息为预先存储至校对模块内的文本,所述校对模块将所述文本信息与所述预设对照答案信息进行比对,其中,若所述文本信息与预设对照答案信息相同,则所述校对模块判定所述文本信息正确,若所述文本信息与预设对照答案信息不同,则所述校对模块判定所述文本信息错误。
[0014]与现有技术相比,本专利技术通过设置本专利技术设置数据库模块、数据获取模块、数据处理模块以及数据校对模块,获取用户端上传的图片信息,并基于图片信息识别图片中答案对应的文本轮廓,将文本轮廓与数据库中存储的轮廓图案进行对比,确定文本轮廓对应的文字,在文本轮廓与轮廓图案的重合度较低时,考虑相邻文本轮廓的文字的关联文字,在调整重合度对比阈值后,重新获取文本轮廓与关联文字对应的轮廓图案的重合度对比结果,进而提高对文本轮廓对应的文字的识别率。
[0015]尤其,本专利技术的数据处理模块基于文字轮廓的清晰度参量对文字轮廓进行筛选,只对筛选出的文字轮廓判定其对应的文字,在实际情况中由于书写的差异性,导致用户端上传的图片信息中的文字轮廓具有较大的差异性,部分文字轮廓清晰度较差或与其他文字轮廓交合,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像识别的作业错题收集系统,其特征在于,包括:数据库模块,其包括用以存储各文字之间的关联关系的第一存储单元以及用以存储若干文字轮廓的第二存储单元,各所述文字轮廓与文字间预建立有对应关系;数据获取模块,其与用户端连接,用以接收用户端发送的图片信息;数据处理模块,其包括第一数据对比单元、第二数据对比单元、第一解析单元以及第二解析单元,所述第一数据对比单元与所述数据获取模块相连接,用以接收所述图片信息并提取图片信息中答案的文字轮廓,并基于各所述文字轮廓的清晰度参量对各所述文字轮廓进行筛选;所述第二数据对比单元与所述第一数据对比单元以及数据库模块分别连接,用以计算所述第一数据对比单元筛选出的文字轮廓与所述数据库模块中存储的各轮廓图案的重合度,并将各所述重合度与重合度对比阈值或重合度修正对比阈值进行对比,以获取所述文字轮廓与各所述轮廓图案的重合度对比结果;所述第一解析单元与所述第二数据对比单元以及数据库模块分别连接用以在第一重合度对比结果下,基于文字轮廓与各轮廓图案的重合度排序确定所述文字轮廓所对应的文字,并根据已确定的所有文字生成文本信息;所述第二解析单元与所述第二数据对比单元以及数据库模块分别连接,用以在第二重合度对比结果下,确定所述文字轮廓的相邻文字轮廓所对应的文字,并确定各所述文字的关联文字对应的轮廓图案,并将各所述轮廓图案发送至第二数据对比单元,以使所述第二数据对比单元修正所述重合度对比阈值后重新获取所述文字轮廓与已接收轮廓图案的重合度对比结果;校对模块,其与所述第一解析单元连接,用以将所述第一解析单元生成的文本信息与预设对照答案信息进行对比并判定所述文本信息是否错误。2.根据权利要求1所述的基于图像识别的作业错题收集系统,其特征在于,所述第一重合度对比结果为所述文字轮廓与至少一个轮廓图案的重合度大于等于所述重合度对比阈值或重合度修正对比阈值;所述第二重合度对比结果为所述文字轮廓与全部轮廓图案的重合度均小于所述重合度对比阈值或重合度修正对比阈值。3.根据权利要求1所述的基于图像识别的作业错题收集系统,其特征在于,所述第一数据对比单元按照公式(1)计算各文字轮廓对应的清晰度参量D,(1)公式(1)中,S表示文字轮廓的面积,S0表示各文字轮廓的平均面积值,C表示文字轮廓的色度值,C0表示各文字轮廓的平均色度值。4.根据权利要求3所述的基于图像识别的作业错题收集系统,其特征在于,所述第一数据对比单元将文字轮廓对应的文字清晰参量D与预设清晰度对比参量D1进行对比,并根据对比结果将文字轮廓筛选出,其中,若对比结果满足第一预设条件,所述第一数据对比单元判定将所述文字轮廓筛选出;
所述第一预设条件为D≥...

【专利技术属性】
技术研发人员:苏楠明梁城栋黄富强陈建勇
申请(专利权)人:福建鹿鸣教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1