面向考试领域的手写中文行识别方法及系统技术方案

技术编号：37398628 阅读：26 留言：0更新日期：2023-04-30 09:27

本发明专利技术涉及图像处理技术领域，公开了面向考试领域的手写中文行识别方法及系统；方法包括：获取待识别的单行手写中文图像；将待识别的单行手写中文图像，输入到训练后的第一手写中文行识别模型中，输出手写中文行识别结果；模型用于对待识别的单行手写中文图像进行特征提取得到特征图；对特征图进行像素提取得到特征图上包含文本信息的区域特征；对特征图上包含文本信息的区域特征进行压缩处理得到序列化向量；对序列化向量进行上下文信息提取得到上下文信息；对上下文信息进行分类得到概率分布矩阵；对概率分布矩阵进行解码处理得到最终的识别结果。本发明专利技术能够对多行文本行组成的段落图像进行识别，提高了识别的速度。提高了识别的速度。提高了识别的速度。

全部详细技术资料下载

【技术实现步骤摘要】
面向考试领域的手写中文行识别方法及系统

[0001]本专利技术涉及图像处理
，特别是涉及面向考试领域的手写中文行识别方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
，并不必然构成现有技术。
[0003]文本识别是机器学习和计算机视觉领域的一个热门方向。在教育考试领域，非选择题类题目仍然主要以手写文字的方式作答。在试卷评分的过程中，目前仍然处于评卷教师从考生答题卡的扫描图像中辨认考试书写内容进而给出分数的现状中。对此，将大量的图像数据转写为文本化数据是十分必要的。这样的策略既能对试卷进行智能评分，提高评卷质量和效率；又能基于大数据分析的角度，从多个维度分析考试试题质量、考察考生答题结果，并将其反馈给考试管理和命题机构，对改进学生学习方法、提高教师教学质量和命题水平提供辅助方案。
[0004]文本识别方法可以按照是否对字符分割分为两类：一类是基于分割的方法，即将文本行图像中每个字符的位置进行定位，进而将文本行以字符为单位进行分割，然后对分割出的单个字符使用字符分类器进行...

【技术保护点】

【技术特征摘要】
1.面向考试领域的手写中文行识别方法，其特征是，包括：获取待识别的单行手写中文图像；将待识别的单行手写中文图像，输入到训练后的第一手写中文行识别模型中，输出手写中文行识别结果；其中，所述训练后的第一手写中文行识别模型，包括：对待识别的单行手写中文图像进行特征提取，得到特征图；对特征图进行像素提取，得到特征图上包含文本信息的区域特征；对特征图上包含文本信息的区域特征进行压缩处理，得到序列化向量；对序列化向量进行上下文信息提取，得到上下文信息；对上下文信息进行分类，得到概率分布矩阵；对概率分布矩阵进行解码处理，得到最终的识别结果。2.如权利要求1所述的面向考试领域的手写中文行识别方法，其特征是，所述训练后的第一手写中文行识别模型，其网络结构包括：依次连接的第一特征提取模块、第一像素提取模块、第一特征压缩模块、上下文提取模块、第一分类器和第一解码器；其中，所述第一特征提取模块，采用残差神经网络来实现；所述第一特征提取模块，用于对待识别的手写中文图像进行特征提取，得到特征图；所述第一像素提取模块，采用注意力机制模块来实现；所述第一像素提取模块，对特征图采用注意力机制模块进行处理，得到每个像素的权重；将特征图和每个像素的权重进行相乘，得到特征图上包含文本信息的区域特征；所述第一特征压缩模块，用于对特征进行压缩处理；所述上下文提取模块，通过双向长短期记忆网络来实现；所述第一分类器，通过一层全连接神经网络实现，其接收经过上下文提取模块处理后得到的特征向量作为输入，输出为概率分布矩阵；所述第一解码器，通过解码器来实现。3.如权利要求1所述的面向考试领域的手写中文行识别方法，其特征是，所述训练后的第一手写中文行识别模型，其训练过程包括：构建第一训练集；其中，所述第一训练集，为已知手写中文行识别结果的单行手写中文图像；将第一训练集，输入到第一手写中文行识别模型中，对模型进行训练，当模型的总损失函数值不再下降时，停止训练，得到训练后的第一手写中文行识别模型。4.如权利要求3所述的面向考试领域的手写中文行识别方法，其特征是，所述构建第一训练集，包括：对图像进行预处理，所述预处理，包括：数据增广处理、数据清洗处理和数据映射处理；所述数据增广处理，是通过高斯模糊、随机平移、随机裁剪、填充空白像素方式进行数据增广；所述数据清洗，处理，是指剔除非法数据；所述数据映射处理，是构建字符字典，然后根据字符字典将汉字映射为可训练的数字。5.如权利要求3所述的面向考试领域的手写中文行识别方法，其特征是，所述模型的总损失函数为：
；其中，epoch表示训练迭代轮数,表示解码器的损失函数，表示第一像素提取模块的损失函数，表示总损失函数。6.如权利要求1所述的面向考试领域的手写中文行识别方法，其特征是，所述方法，还包括：如果手写中文行识别是对多行手写中文图像的识别，则构建第二训练集；其中，所述第二训练集，为已...

【专利技术属性】
技术研发人员：许信顺，李昊，马磊，陈义学，李溢欢，
申请(专利权)人：山东山大鸥玛软件股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人