当前位置: 首页 > 专利查询>北京大学专利>正文

一种英文书写质量的自动评阅方法、系统、设备及介质技术方案

技术编号:38988280 阅读:11 留言:0更新日期:2023-10-07 10:18
本发明专利技术公开一种英文书写质量的自动评阅方法、系统、设备及介质,涉及书写质量评阅技术领域。该方法包括:获取目标书法图像;目标书法图像为待评阅书法作品的扫描图像;采用书写质量评阅模型对目标书法图像进行评阅,得到待评阅书法作品的分数和奖项;分数包括:指标得分和作品总分;指标得分包括:水平角度一致性得分、倾斜角度一致性得分、字母大小一致性得分、字符间距一致性得分和单词间距一致性得分;其中,书写质量评阅模型包括:评分模式选择模块、评分模块和后处理模块;评分模块包括:粗略评分网络和精细评分网络。本发明专利技术能够实现对英文手写作品整体卷面美观程度的客观、准确评价。准确评价。准确评价。

【技术实现步骤摘要】
一种英文书写质量的自动评阅方法、系统、设备及介质


[0001]本专利技术涉及书写质量评阅
,特别是涉及一种英文书写质量的自动评阅方法、系统、设备及介质。

技术介绍

[0002]见字如面,书写能力是学生必须具备的能力,不仅大大影响纸面作品的美观程度,还体现了一个人的文化素养。英文书写美观度除了受单个字母的美观度影响,更重要的是整体的整齐度。很多学校开展了专门的书写课程,还有一些机构举办英文书法比赛,鼓励学生训练书写能力。书写能力的提升需要大量的训练,需要专业老师的指导,但是指导老师往往不能同时面对很多学生,给出及时的反馈,使得教学质量大打折扣。利用人工智能的方法对书写质量评估,并给出及时的批改意见,可以大大提高教学效率,也有利于使用者进行自主提升。
[0003]人工智能在教育领域得到了长足发展和成功应用,一些针对书写质量评估的方法也获得了一定的发展。但是这些方法大都是针对单个字符的评估与辅助教学,对整体美观度的评价还并没有很好的方法。
[0004]申请号为202210799266.1的专利公开了一种基于结构属性和深度神经网络的汉字书写智能评分方法及系统。其针对汉字的结构属性对汉字进行切割,构建数据集,由专业人士对十个属性进行打分,生成数据集。以此为基础训练了一个深度网络,对单个汉字的美观程度打分。这个方法仅仅对单个汉字提出评价,忽略了整体书面的美观度,并且没有给出指导意见。
[0005]申请号为202110100196.1的专利公开了一种基于机器学习的书法临帖智能评价与评语生成办法,首先对图像进行预处理,然后生成字形匹配重合度评分、结构匹配重合度评分、投影相似度评分、书法字体关键点相似度评分,最后通过机器学习回归出综合评分,并且通过回归出的分数给出指导意见。这个方法依赖字帖,通过和字帖的重合度对书写美观度进行评价,由于对字帖的依赖,导致其应用场景十分受限,并且只能对单个字符提出进行评价,而整体书面的整齐程度更加影响整体美观度。

技术实现思路

[0006]本专利技术的目的是提供一种英文书写质量的自动评阅方法、系统、设备及介质,以实现对英文手写作品整体卷面美观程度的评价。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种英文书写质量的自动评阅方法,包括:
[0009]获取目标书法图像;所述目标书法图像为待评阅书法作品的扫描图像;
[0010]采用书写质量评阅模型对所述目标书法图像进行评阅,得到所述待评阅书法作品的分数和奖项;所述分数包括:指标得分和作品总分;所述指标得分包括:水平角度一致性得分、倾斜角度一致性得分、字母大小一致性得分、字符间距一致性得分和单词间距一致性
得分;
[0011]其中,所述书写质量评阅模型包括:评分模式选择模块、评分模块和后处理模块;所述评分模块包括:粗略评分网络和精细评分网络;
[0012]所述评分模式选择模块用于对所述目标书法图像进行二分类,得到分类结果;所述分类结果包括:所述待评阅书法作品为一定不得奖作品或所述待评阅书法作品为得奖候选作品;
[0013]所述评分模块用于根据所述分类结果对所述目标书法图像进行评分,得到所述待评阅书法作品的每一行的指标得分;其中,所述粗略评分网络用于对所述一定不得奖作品进行评分,所述精细评分网络用于对所述得奖候选作品进行评分;
[0014]所述后处理模块用于根据所述待评阅书法作品的每一行的指标得分确定所述待评阅书法作品的分数和奖项。
[0015]可选地,所述书写质量评阅模型中的评分模式选择模块和评分模块的确定方法具体包括:
[0016]获取书法作品数据集;所述书法作品数据集包括强标签样本数据集和弱标签样本数据集;所述强标签样本数据集中包括若干样本书法图像以及对应的分数和奖项;所述弱标签样本数据集中包括若干样本书法图像以及对应的奖项;所述样本书法图像为已评阅书法作品的扫描图像;
[0017]根据分数线分值,将所述强标签样本数据集划分为一定不得奖作品数据集和得奖候选作品数据集;
[0018]利用所述一定不得奖作品数据集和所述得奖候选作品数据集训练第一卷积神经网络,得到评分模式选择模块;
[0019]利用所述一定不得奖作品数据集训练第二卷积神经网络,得到粗略评分网络;
[0020]利用所述得奖候选作品数据集训练第二卷积神经网络,得到初始评分网络;
[0021]利用所述初始评分网络对所述弱标签样本数据集进行伪标签增补,得到增补标签样本数据集;
[0022]利用所述强标签样本数据集和所述增补标签样本数据集训练所述初始评分网络,得到精细评分网络。
[0023]可选地,利用所述初始评分网络对所述弱标签样本数据集进行伪标签增补,得到增补标签样本数据集,具体包括:
[0024]根据作品总分所在区间,将所述得奖候选作品数据集划分为第一训练集、第二训练集和第三训练集;所述第一训练集中的样本书法图像对应的作品总分大于第一分数值且小于或等于满分分数值,所述第二训练集中的样本书法图像对应的作品总分大于第二分数值且小于或等于第三分数值,所述第三训练集中的样本书法图像对应的作品总分大于分数线分值且小于或等于第一分数值;其中,分数线分值小于第二分数值,第二分数值小于第一分数值,第一分数值小于第三分数值,第三分数值小于满分分数值;
[0025]利用所述第一训练集训练所述初始评分网络,得到第一教师模型,利用所述第二训练集训练所述初始评分网络,得到第二教师模型,利用所述第三训练集训练所述初始评分网络,得到第三教师模型;
[0026]根据奖项的等级,将所述弱标签样本数据集划分为高奖项样本数据集和低奖项样
本数据集;
[0027]利用所述第一教师模型对所述高奖项样本数据集中的样本书法图像进行第一轮伪标签增补和置信度计算,得到第一增补数据集和第一候选数据集;
[0028]利用所述第三教师模型对所述低奖项样本数据集中的样本书法图像进行第一轮伪标签增补和置信度计算,得到第二增补数据集和第二候选数据集;
[0029]利用所述第二教师模型对所述第一候选数据集和所述第二候选数据集中的样本书法图像进行第二轮伪标签增补和置信度计算,得到第三增补数据集和被放弃数据集;
[0030]将所述第一增补数据集、所述第二增补数据集和所述第三增补数据集确定为增补标签样本数据集。
[0031]可选地,利用所述强标签样本数据集和所述增补标签样本数据集训练所述初始评分网络,得到精细评分网络,具体包括:
[0032]将所述强标签样本数据集中的样本书法图像输入至所述初始评分网络中,得到强标签数据的预测结果;所述强标签数据为所述强标签样本数据集中的样本书法图像;
[0033]将所述增补标签样本数据集中的样本书法图像输入至所述初始评分网络中,得到弱标签数据的预测结果;所述弱标签数据为所述增补标签样本数据集中的样本书法图像;
[0034]根据所述强标签数据的预测结果和对应的真实标签以及所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种英文书写质量的自动评阅方法,其特征在于,包括:获取目标书法图像;所述目标书法图像为待评阅书法作品的扫描图像;采用书写质量评阅模型对所述目标书法图像进行评阅,得到所述待评阅书法作品的分数和奖项;所述分数包括:指标得分和作品总分;所述指标得分包括:水平角度一致性得分、倾斜角度一致性得分、字母大小一致性得分、字符间距一致性得分和单词间距一致性得分;其中,所述书写质量评阅模型包括:评分模式选择模块、评分模块和后处理模块;所述评分模块包括:粗略评分网络和精细评分网络;所述评分模式选择模块用于对所述目标书法图像进行二分类,得到分类结果;所述分类结果包括:所述待评阅书法作品为一定不得奖作品或所述待评阅书法作品为得奖候选作品;所述评分模块用于根据所述分类结果对所述目标书法图像进行评分,得到所述待评阅书法作品的每一行的指标得分;其中,所述粗略评分网络用于对所述一定不得奖作品进行评分,所述精细评分网络用于对所述得奖候选作品进行评分;所述后处理模块用于根据所述待评阅书法作品的每一行的指标得分确定所述待评阅书法作品的分数和奖项。2.根据权利要求1所述的英文书写质量的自动评阅方法,其特征在于,所述书写质量评阅模型中的评分模式选择模块和评分模块的确定方法具体包括:获取书法作品数据集;所述书法作品数据集包括强标签样本数据集和弱标签样本数据集;所述强标签样本数据集中包括若干样本书法图像以及对应的分数和奖项;所述弱标签样本数据集中包括若干样本书法图像以及对应的奖项;所述样本书法图像为已评阅书法作品的扫描图像;根据分数线分值,将所述强标签样本数据集划分为一定不得奖作品数据集和得奖候选作品数据集;利用所述一定不得奖作品数据集和所述得奖候选作品数据集训练第一卷积神经网络,得到评分模式选择模块;利用所述一定不得奖作品数据集训练第二卷积神经网络,得到粗略评分网络;利用所述得奖候选作品数据集训练第二卷积神经网络,得到初始评分网络;利用所述初始评分网络对所述弱标签样本数据集进行伪标签增补,得到增补标签样本数据集;利用所述强标签样本数据集和所述增补标签样本数据集训练所述初始评分网络,得到精细评分网络。3.根据权利要求2所述的英文书写质量的自动评阅方法,其特征在于,利用所述初始评分网络对所述弱标签样本数据集进行伪标签增补,得到增补标签样本数据集,具体包括:根据作品总分所在区间,将所述得奖候选作品数据集划分为第一训练集、第二训练集和第三训练集;所述第一训练集中的样本书法图像对应的作品总分大于第一分数值且小于或等于满分分数值,所述第二训练集中的样本书法图像对应的作品总分大于第二分数值且小于或等于第三分数值,所述第三训练集中的样本书法图像对应的作品总分大于分数线分值且小于或等于第一分数值;其中,分数线分值小于第二分数值,第二分数值小于第一分数值,第一分数值小于第三分数值,第三分数值小于满分分数值;
利用所述第一训练集训练所述初始评分网络,得到第一教师模型,利用所述第二训练集训练所述初始评分网络,得到第二教师模型,利用所述第三训练集训练所述初始评分网络,得到第三教师模型;根据奖项的等级,将所述弱标签样本数据集划分为高奖项样本数据集和低奖项样本数据集;利用所述第一教师模型对所述高奖项样本数据集中的样本书法图像进行第一轮伪标签增补和置信度计算,得到第一增补数据集和第一候选数据集;利用所述第三教师模型对所述低奖项样本数据集中的样本书法图像进行第一轮伪标签增补和置信度计算,得到第二增补数据集和第二候选数据集;利用所述第二教师模型对所述第一候选数据集和所述第二候选数据集中的样本书法图像进行第二轮伪标签增补和置信度计算,得到第三增补数据集和被放弃数据集;将所述第一增补数据集、所述第二增补数据集和所述第三增补数据集确定为增补标签样本数据集。4.根据权利要求2所述的英文书写质量的自动评阅方法,其特征在于,利用所述强标签样本数据集和所述增补标签样本数据集训练所述初始评分网络,得到精细评分网络,具体包括:将所述强标签样本数据集中的样本书法图像输入至所述初始评分网络中,得到强标签数据的预测结果;所述强标签数据为所述强标签样本数据集中的样本书法图像;将所述增补标签样本数据集中的样本书法图像输入至所述初始评分网络中,得到弱标签数据的预测结果;所述弱标签数据为所述增补标签样本数据集中的样本书法图像;根据所述强标签数据的预测结果和对应的真实标签以及所述弱标签数据的预测结果和对应的伪标签与置信度确定目标损失函数;其中,所述真实标签为所述强...

【专利技术属性】
技术研发人员:段晓辉刘森吴泷彬谢宇飞
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1