一种基于深度学习的汉字书写质量评价方法技术

技术编号:28038449 阅读:18 留言:0更新日期:2021-04-09 23:21
一种基于深度学习的汉字书写质量评价方法,所述该方法包括如下步骤:步骤一:收集手写汉子并建立字库,采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等,本发明专利技术通过深度的学习卷积神经网络Deep‑CNN结构,让AI可以更充分的接触到更多的文字和图形,并且这种文字和图形是通过大量的收集获得,可以是用户在学习的时候比对更加详细,通过大数据来实现文字的测评。

【技术实现步骤摘要】
一种基于深度学习的汉字书写质量评价方法
本专利技术涉及一种基于深度学习的汉字书写质量评价方法,属于智能测评领域。
技术介绍
AI是很常见的一种互联网智能系统,人们在各种场景均有具体的运用,如城市交通指挥,铁路运输指挥等等,但是这些都是大型的设备上使用,AI也是通过大量的数据,经过学习和锻炼形成的一种高速运转的智能系统,这些系统均是可以有意可循的,可以找的到规律的,某些没有规律的东西,比如字体,每个人写出来的字体均是不一样的,每个人对字体的审美也均不同,但是怎么通过一个不规律的东西能够体现出大家都觉得漂亮的字体,这个仅仅只是AI来判断是非常难的。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种可行的方法,简单的步骤,将没有规律的可寻的文字变换成一个可以通过智能AI来实现测评的方法:本专利技术的目的是通过如下技术方案来完成的,一种基于深度学习的汉字书写质量评价方法,所述该方法包括如下步骤:步骤一:收集手写汉子并建立字库采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等。步骤二:基于生成对抗神经网络GAN的数据扩展在以上小规模以标注数据集基础上,使用半监督深度学习模型。通过将循环神经网络和生成式对抗网络GAN相结合的方法使循环神经网络学习到数据的标注关系和特征,使生成式对抗网络产生GAN合理数据进而扩展数据集。后经过数据处理等工作,形成可用于模型训练的可靠数据集,缓解了和补齐数据集紧缺的问题。此后,使用深度学习卷积神经网络Deep-CNN结构;步骤三:深度学习卷积神经网络Deep-CNN结构步骤四:训练数据生成模型通过对大量的标注信息的手写汉字集的训练,提取评价汉字书写质量的特征,如汉字的结构特征、形态特征、重心特征、笔画特征、偏旁特征、和标准模版字的相似度特征以及汉字的整体书写质量特征。步骤五:测试模型的准确率利用第一步收集并标注字库的一部分作为测试集来检验通过训练得到的模型的准确率。步骤六:使用模型评价汉字书写质量提取用户书写的汉字然后通过此模型可得到该汉字书写质量的评分和评价,如结构、形态、重心、笔画、偏旁、与标准模版字相似度等方面的分数和书写评价,以及汉字的整体书写分和评价。通过深度的学习卷积神经网络Deep-CNN结构,让AI可以更充分的接触到更多的文字和图形,并且这种文字和图形是通过大量的收集获得,可以是用户在学习的时候比对更加详细,通过大数据来实现文字的测评。具体实施方式下面对本专利技术作详细的介绍:一种基于深度学习的汉字书写质量评价方法,所述该方法包括如下步骤:步骤一:收集手写汉子并建立字库采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等。步骤二:基于生成对抗神经网络GAN的数据扩展在以上小规模以标注数据集基础上,使用半监督深度学习模型。通过将循环神经网络和生成式对抗网络GAN相结合的方法使循环神经网络学习到数据的标注关系和特征,使生成式对抗网络产生GAN合理数据进而扩展数据集。后经过数据处理等工作,形成可用于模型训练的可靠数据集,缓解了和补齐数据集紧缺的问题。此后,使用深度学习卷积神经网络Deep-CNN结构;步骤三:深度学习卷积神经网络Deep-CNN结构步骤四:训练数据生成模型通过对大量的标注信息的手写汉字集的训练,提取评价汉字书写质量的特征,如汉字的结构特征、形态特征、重心特征、笔画特征、偏旁特征、和标准模版字的相似度特征以及汉字的整体书写质量特征。步骤五:测试模型的准确率利用第一步收集并标注字库的一部分作为测试集来检验通过训练得到的模型的准确率。步骤六:使用模型评价汉字书写质量本专利技术在收集大量的书写文字,让计算机AI进行自我深度学习,通过学习后在计算大数据下,可以得出大多数人的写字习惯和大多数人觉得那些文字是漂亮的,在通过常年积累,得出一个比较完整的结论,通过这个结论,在与现有的文字进行比对,可以让更多的人了解情况自己的字体的评分情况。本文档来自技高网...

【技术保护点】
1.一种基于深度学习的汉字书写质量评价方法,其特征在于所述该方法包括如下步骤:/n步骤一:收集手写汉子并建立字库/n采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等;/n步骤二:基于生成对抗神经网络GAN的数据扩展/n在以上小规模以标注数据集基础上,使用半监督深度学习,通过将循环神经网络和生成式对抗网络GAN相结合的方法使循环神经网络学习到数据的标注关系和特征,使生成式对抗网络产生GAN合理数据进而扩展数据集,后经过数据处理等工作,形成可用于模型训练的可靠数据集,缓解了和补齐数据集紧缺的问题,此后,使用深度学习卷积神经网络Deep-CNN结构;/n步骤三:深度学习卷积神经网络Deep-CNN结构/n步骤四:训练数据生成模型/n通过对大量的标注信息的手写汉字集的训练,提取评价汉字书写质量的特征,如汉字的结构特征、形态特征、重心特征、笔画特征、偏旁特征、和标准模版字的相似度特征以及汉字的整体书写质量特征;/n步骤五:测试模型的准确率/n利用第一步收集并标注字库的一部分作为测试集来检验通过训练得到的模型的准确率;/n步骤六:使用模型评价汉字书写质量/n提取用户书写的汉字然后通过此模型可得到该汉字书写质量的评分和评价,如结构、形态、重心、笔画、偏旁、与标准模版字相似度等方面的分数和书写评价,以及汉字的整体书写分和评价。/n...

【技术特征摘要】
1.一种基于深度学习的汉字书写质量评价方法,其特征在于所述该方法包括如下步骤:
步骤一:收集手写汉子并建立字库
采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等;
步骤二:基于生成对抗神经网络GAN的数据扩展
在以上小规模以标注数据集基础上,使用半监督深度学习,通过将循环神经网络和生成式对抗网络GAN相结合的方法使循环神经网络学习到数据的标注关系和特征,使生成式对抗网络产生GAN合理数据进而扩展数据集,后经过数据处理等工作,形成可用于模型训练的可靠数据集,...

【专利技术属性】
技术研发人员:孙进军潘勇于卫星
申请(专利权)人:浙江优学智能科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1