一种汉字书写评价系统技术方案

技术编号:23344698 阅读:17 留言:0更新日期:2020-02-15 04:19
一种汉字书写评价系统,属于手写汉字评价技术领域。本发明专利技术为了解决现有的汉字书写质量评价方法存在准确率低或者效率低的问题。本发明专利技术包括:用于采集书写汉字的图像的图像采集模块、用于将采集的图像调整到固定大小的图像预处理单元、用于根据预处理后的图像对文字进行定位的文字定位模块、用于对定位后的汉字进行识别的文字识别模块、根据文字识别模块识别的每个汉字,在数据库中提出相应汉字的标准字形,将识别的每个汉字与标准字形进行比对,并进行打分的文字对比打分模块,以及用于存储汉字的标准字形的数据库。主要用于书写汉字的评价。

An evaluation system of Chinese character writing

【技术实现步骤摘要】
一种汉字书写评价系统
本专利技术属于手写汉字评价
,具体涉及一种基于图像处理技术的汉字评价系统及方法。
技术介绍
汉字不仅仅是一种记录和表达的工具,还具有精神表达的作用。书写规范的汉字能够便于内容的识别,从而更加准确的获取书写者要表达的含义。每个人在开始学习汉字或者练字的时候都是按照标准的字体进行学习或者练习,例如按照楷体进行练习。为了保证学习或者练习的效果,都是需要在练字或写字之后进行质量评判,即看看写的怎么样,目前的汉字书写质量大都是人为进行评价的,由评价者根据某种字体的汉字规则进行评价,基本都是由教师或者专业人员来对字体评价进行,一般人只能从主观印象看字是否工整而已,并不能真正的对汉字书写质量进行评价。即使教师或者专业人员进行评价,其也存在一定的主观因素,从而导致书写评价不仅不够客观,而且缺乏相对的统一标准,所以对汉字的书写评价不够准确;还有就是这种评价方法效率极低。基于以上缺陷,目前也有一些研究人员致力于通过其他手段对汉字书写进行评价,如采用图像识别和机器学习结合来进行评价,但是其仅仅能够粗略的判断书写的好坏,如“好”“一般”“差”等。不能更加细致和准确的进行评价。虽然目前的人工智能和深度学习技术已经能够实现文字的高识别率,但是其研究重点是对书写不规范的字如何识别其是什么字,即怎么将不规范的字准确的识别出来,但是不能准确的对字的书写质量进行评价。
技术实现思路
本专利技术为了解决现有的汉字书写质量评价方法存在准确率低或者效率低的问题。一种汉字书写评价系统,包括:>图像采集模块,用于采集书写汉字的图像;图像预处理单元,用于将采集的图像调整到固定大小;文字定位模块,用于根据预处理后的图像对文字进行定位;文字识别模块,用于对定位后的汉字进行识别;文字对比打分模块,根据文字识别模块识别的每个汉字,在数据库中提出相应汉字的标准字形,将识别的每个汉字与标准字形进行比对,并进行打分;数据库,用于存储汉字的标准字形;所述的数据库包括各种字体的汉字字形子库;所述文字对比打分模块将识别的每个汉字与标准字形进行比对并进行打分的过程如下:分别对识别网络模型识别的文字和相应汉字的标准字形进行归一化;计算归一化后的识别文字和相应汉字的标准字形之间的距离,将距离作为输入,利用评分神经网络模型进行打分。进一步地,采用欧式距离计算归一化后的识别文字和相应汉字的标准字形之间的距离。进一步地,所述的评分神经网络模型如下:在训练过程中,分别对识别的文字和相应汉字的标准字形进行归一化;同时对识别的文字进行标记,标签为对应的分数;然后计算识别的文字与标准字形之间的距离,将距离作为输入,以标签作为输出,训练神经网络模型,得到训练好的神经网络模型,即评分神经网络。进一步地,所述的文字定位模块进行文字定位的过程如下:采用YOLOv3网络进行文字定位,所述的YOLOv3网络包括一个darknet-53网络模型和YOLOdetection单元;darknet-53网络模型结构如下:第一单元:DBL结构→DBL结构,第一单元连接第二单元;第二单元:DBL结构→DBL结构→Residual结构,第二单元连接第三单元;第三单元:DBL结构,第三单元连接第四单元;第四单元:DBL结构→DBL结构→Residual结构,第四单元连接第五单元;第五单元:DBL结构,第五单元连接第六单元;第六单元:DBL结构→DBL结构→Residual结构,第六单元输出featuremap1,同时第六单元连接第七单元;第七单元:DBL结构,第七单元连接第八单元;第八单元:DBL结构→DBL结构→Residual结构,第八单元输出featuremap2,同时第八单元连接第九单元;第九单元:DBL结构,第九单元连接第十单元;第十单元:DBL结构→DBL结构→Residual结构,第十单元输出featuremap3;所述的DBL结构结构:convlayer→BNlayer→LeakyReLUlayer;所述BNlayer(BatchNormalizationlayer)为批次归一化层;所述的Residual结构结构:1*1的DBL结构→3*3的DBL结构;YOLOdetection单元结构如下:featuremap3经过DBL*5之后分为两路,一路经过DBL和Convlayer之后作为输出y1,另一路经过DBL后进行上采样,之后与featuremap3进行concat操作之后→DBL*5;经过DBL*5之后再分为两路,一路经过DBL和Convlayer之后作为输出y2,另一路经过DBL后进行上采样,之后与featuremap1进行concat操作之后→DBL*5,然后经过DBL和Convlayer之后作为输出y3。进一步地,所述的文字识别模块对定位后的汉字进行识别的过程如下:采用识别网络模型对定位后的汉字进行识别出书写的汉字,所述识别网络模型结构如下:第一单元:(convlayer→convlayer→convlayer→poollayer)*2;第一单元连接第二单元;第二单元:[输入分别进入四个支路,支路1:1*1convlayer;支路2:poollayer→1*1convlayer;支路3:1*1convlayer→3*3convlayer;支路4:1*1convlayer→(3*3convlayer)*2;四个支路输出共同进入filterconcatlayer]*3;第二单元连接第三单元;第三单元:输入分别进入三个支路,支路1:1*1convlayer;支路2:1*1convlayer→3*3convlayer;支路3:poollayer;三个支路输出共同进入filterconcatlayer;第三单元连接第四单元;第四单元:[输入分别进入四个支路,支路1:1*1convlayer;支路2:poollayer→1*1convlayer;支路3:经过1*1convlayer→1*7convlayer→7*1convlayer;支路4:经过1*1convlayer→(1*7convlayer→7*1convlayer)*2;四个支路输出共同进入filterconcatlayer]*3;第四单元连接第五单元;第五单元:输入分别进入三个支路,支路1:1*1convlayer→3*3convlayer;支路2:1*1convlayer→3*3convlayer→1*1convlayer;支路3:poollayer;三个支路输出共同进入filterconcatlayer;第五单元分别连接第六单元;第六单元:[(输入分别进入四个支路,支路1:1*1convlayer;支路2:poollayer→1*1convlayer;支路3:1*1convlayer后分别进入1本文档来自技高网...

【技术保护点】
1.一种汉字书写评价系统,其特征在于,包括:/n图像采集模块,用于采集书写汉字的图像;/n图像预处理单元,用于将采集的图像调整到固定大小;/n文字定位模块,用于根据预处理后的图像对文字进行定位;/n文字识别模块,用于对定位后的汉字进行识别;/n文字对比打分模块,根据文字识别模块识别的每个汉字,在数据库中提出相应汉字的标准字形,将识别的每个汉字与标准字形进行比对,并进行打分;/n数据库,用于存储汉字的标准字形;所述的数据库包括各种字体的汉字字形子库;/n所述文字对比打分模块将识别的每个汉字与标准字形进行比对并进行打分的过程如下:/n分别对识别网络模型识别的文字和相应汉字的标准字形进行归一化;/n计算归一化后的识别文字和相应汉字的标准字形之间的距离,将距离作为输入,利用评分神经网络模型进行打分。/n

【技术特征摘要】
1.一种汉字书写评价系统,其特征在于,包括:
图像采集模块,用于采集书写汉字的图像;
图像预处理单元,用于将采集的图像调整到固定大小;
文字定位模块,用于根据预处理后的图像对文字进行定位;
文字识别模块,用于对定位后的汉字进行识别;
文字对比打分模块,根据文字识别模块识别的每个汉字,在数据库中提出相应汉字的标准字形,将识别的每个汉字与标准字形进行比对,并进行打分;
数据库,用于存储汉字的标准字形;所述的数据库包括各种字体的汉字字形子库;
所述文字对比打分模块将识别的每个汉字与标准字形进行比对并进行打分的过程如下:
分别对识别网络模型识别的文字和相应汉字的标准字形进行归一化;
计算归一化后的识别文字和相应汉字的标准字形之间的距离,将距离作为输入,利用评分神经网络模型进行打分。


2.根据权利要求1所述的一种汉字书写评价系统,其特征在于,采用欧式距离计算归一化后的识别文字和相应汉字的标准字形之间的距离。


3.根据权利要求1或2所述的一种汉字书写评价系统,其特征在于,所述的评分神经网络模型如下:
在训练过程中,分别对识别的文字和相应汉字的标准字形进行归一化;同时对识别的文字进行标记,标签为对应的分数;
然后计算识别的文字与标准字形之间的距离,将距离作为输入,以标签作为输出,训练神经网络模型,得到训练好的神经网络模型,即评分神经网络。


4.根据权利要求3所述的一种汉字书写评价系统,其特征在于,所述的文字定位模块进行文字定位的过程如下:
采用YOLOv3网络进行文字定位,所述的YOLOv3网络包括一个darknet-53网络模型和YOLOdetection单元;
darknet-53网络模型结构如下:
第一单元:DBL结构→DBL结构,第一单元连接第二单元;
第二单元:DBL结构→DBL结构→Residual结构,第二单元连接第三单元;
第三单元:DBL结构,第三单元连接第四单元;
第四单元:DBL结构→DBL结构→Residual结构,第四单元连接第五单元;
第五单元:DBL结构,第五单元连接第六单元;
第六单元:DBL结构→DBL结构→Residual结构,第六单元输出featuremap1,同时第六单元连接第七单元;
第七单元:DBL结构,第七单元连接第八单元;
第八单元:DBL结构→DBL结构→Residual结构,第八单元输出featuremap2,同时第八单元连接第九单元;
第九单元:DBL结构,第九单元连接第十单元;
第十单元:DBL结构→DBL结构→Residual结构,第十单元输出featuremap3;
所述的DBL结构结构:convlayer→BNlayer→LeakyReLUlayer;所述BNlayer(BatchNormalizationlayer)为批次归一化层;
所述的Residual结构结构:1*1的DBL结构→3*3的DBL结构;
YOLOdetection单元结构如下:
featu...

【专利技术属性】
技术研发人员:米红丹秦毅
申请(专利权)人:黑龙江文茁教育科技有限公司
类型:发明
国别省市:黑龙;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1