System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种多类别汉字单样本字体识别方法技术_技高网

一种多类别汉字单样本字体识别方法技术

技术编号:40713450 阅读:5 留言:0更新日期:2024-03-22 11:15
本发明专利技术公开了一种多类别汉字单样本字体识别方法,属于字体识别技术领域,包括:S1、构建汉字字体数据集,并将其处理为对应的字体图像样本集;S2、构建汉字字体识别模型,并利用字体图像样本集对其进行训练;其中,所述汉字字体识别模型采用孪生度量网络结构,引入坐标注意力模块,并采用多重损失函数;S3、利用完成训练及测试的汉字字体识别模型对待识别字体进行字体识别。本发明专利技术提供的汉字字体识别方法解决了汉字字体识别模型在新字体识别扩展、相似字体有效特征提取、书法字体兼容性三方面的问题。

【技术实现步骤摘要】

本专利技术属于字体识别,具体涉及一种多类别汉字单样本字体识别方法


技术介绍

1、在数字技术飞速发展的今天,互联网、数字媒介、视频媒介等技术的快速成熟使得视觉元素占据了信息载体的很大一部分比重,而文字作为其重要的表现形式也是在不断地发展,呈现多样化的形式。与此同时我国对于字体版权的保护也日渐严格,因此对于字体的自动识别提出了迫切的需求。

2、汉字的字符集中文字数量庞大,部件和笔画繁复且变化多样。现有中文字体的国家标准中,一套中文字体至少要包括 6763 个常用字。不同汉字中包含着大量不同结构的部件,甚至同一部件或笔画的不同变体。因此汉字字体存在着复杂性高,感性经验要求高的特征。设计师往往需要经过大量的实践学习,才能对字体有较为准确的感知。人工字体识别存在工作量大、识别率低的问题,迫切地需要自动字体识别技术来取代传统的人工字体识别。

3、字体作为文字属性的重要组成部分,字体样式的表征和识别对于字体搜索、字体推荐、字体替换、字符识别、字体版权保护、文档分析和文档恢复等方面有着重要的意义。

4、目前针对字体识别问题提出的解决方案,大致可以将其分为基于手工设计特征的字体识别和基于深度学习的字体识别两类。其中基于手工设计特征的字体识别,即利用人们的经验手工设计特征提取器来提取每个字符的特征,并以此进行字体分类。但是受到手工特征设计的局限性,一些有用信息容易丟失,此外设计高准确率的特征描述子,需要精细的工程设计和大量的领域专业知识;基于深度学习的字体识别,即使用深度神经网络自动提取字体特征,并利用其特征进行字体分类。但是基于深度卷积模型的方法,对训练过的字体类别识别效果较好,对于模型未训练过的新的字体却无法识别。要扩展识别新字体,就需要将增加的字体样本加入原训练数据中,重新进行训练,无法应对快速增长的汉字字体数量。


技术实现思路

1、针对现有技术中的上述不足,本专利技术提供的多类别汉字单样本字体识别方法解决了传统汉字字体样式识别任务中存在的新字体识别扩展不便、相似字体有效特征提取困难、不兼容书法字体识别的问题。

2、为了达到上述专利技术目的,本专利技术采用的技术方案为:一种多类别汉字单样本字体识别方法,包括以下步骤:

3、s1、构建汉字字体数据集,并将其处理为对应的字体图像样本集;

4、其中,所述汉字字体数据集包括对汉字字体识别模型进行字体识别训练和测试的数据子集和对汉字字体识别模型进行单样本字体识别测试的数据子集;

5、s2、构建汉字字体识别模型,并利用字体图像样本集对其进行训练;

6、其中,所述汉字字体识别模型采用孪生度量网络结构,引入坐标注意力模块,并采用多重损失函数;

7、s3、利用完成训练及测试的汉字字体识别模型对待识别字体进行字体识别。

8、进一步地,所述步骤s1中,对汉字字体识别模型进行字体识别训练和测试的数据子集xike-cfs-1中的汉字字体包括标准印刷字体中每种字体类别中的两种相似字体、软笔书法字体以及硬笔书法字体;

9、对汉字字体识别模型进行单样本识别测试的数据子集xike-cfs-2中的汉字字体包括标准印刷字体、软笔书法字体以及硬笔书法字体。

10、进一步地,所述步骤s2中,所述汉字字体识别模型包括依次连接两个并列的特征提取子网络、特征度量子网络、第三全连接层、第四全连接层以及输出层;

11、两个所述特征提取子网络构成所述汉字字体识别模型的孪生度量网络结构,所述特征提取子网络中引入坐标注意力模块;

12、所述特征度量子网络通过多重损失函数度量两个所述特征提取子网络输出特征向量之间的欧几里得距离,作为两个输入字体样本之间的差异性度量。

13、进一步地,所述特征提取子网络包括依次连接的第一特征提取模块、坐标注意力模块、第二特征提取模块、第三特征提取模块、第四特征提取模块、全局平均池化层、第一全连接层以及第二全连接层;

14、其中,所述第一特征提取模块、第二特征提取模块、第三特征提取模块以及第四特征提取模块均包括依次连接的卷积层、最大池化层、relu激活函数、批归一化层以及dropout层。

15、进一步地,所述坐标注意力模块包括依次连接的两个并列的一维全局平均池化层、多通道一维向量拼接层、卷积压缩层、信息编码层、两个并列的通道数调整层、两个并列的sigmoid函数以及特征加权层,所述特征加权层还与所述坐标注意力模块的输入连接。

16、进一步地,所述多重损失函数包括特征提取损失函数和相似度判别损失函数。

17、进一步地,所述特征提取损失函数为:

18、

19、式中,为样本对个数,为类别数量,为第 n个样本对中样本1的类别标签,为第 n个样本对中样本1经过特征提取子网络预测属于类别 k的概率,为第 n个样本对中样本2的类别标签,为第 n个样本对中样本2经过特征提取子网络预测属于类别 k的概率。

20、进一步地,所述相似度判别损失函数为:

21、

22、式中,为样本对是否归属同一类别的标签,为样本对的降维特征向量和的欧式距离,为距离阈值。

23、进一步地,所述多重损失函数为:

24、

25、式中,为用来控制特征提取损失函数在多重损失函数中的比重的参数。本专利技术的有益效果为:

26、(1)本专利技术提供的汉字字体识别方法解决了汉字字体识别模型在新字体识别扩展、相似字体有效特征提取、书法字体兼容性三方面的问题。

27、(2)本专利技术提供的汉字字体识别模型smfnet采用了孪生度量网络结构,通过坐标注意力模块加强模型对汉字字体间架结构特征的提取能力,使用多重损失函数提高模型提取汉字字体样本特征的泛化性能。

28、(3)本专利技术提供的汉字字体识别模型smfnet在汉字字体数据集中获得了较高的识别准确率,同时实现了高准确率的汉字字体样式的单样本识别,与现有的识别模型相比,也具有较高的识别准确率。

29、(4)本专利技术提供的汉字字体识别模型smfnet支持单样本字体识别,具有较好的新字体识别扩展能力。

本文档来自技高网...

【技术保护点】

1.一种多类别汉字单样本字体识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的多类别汉字单样本字体识别方法,其特征在于,所述步骤S1中,对汉字字体识别模型进行字体识别训练和测试的数据子集XIKE-CFS-1中的汉字字体包括标准印刷字体中每种字体类别中的两种相似字体、软笔书法字体以及硬笔书法字体;

3.根据权利要求2所述的多类别汉字单样本字体识别方法,其特征在于,所述步骤S2中,所述汉字字体识别模型包括依次连接两个并列的特征提取子网络、特征度量子网络、第三全连接层、第四全连接层以及输出层;

4.根据权利要求3所述的多类别汉字单样本字体识别方法,其特征在于,所述特征提取子网络包括依次连接的第一特征提取模块、坐标注意力模块、第二特征提取模块、第三特征提取模块、第四特征提取模块、全局平均池化层、第一全连接层以及第二全连接层;

5.根据权利要求4所述的多类别汉字单样本字体识别方法,其特征在于,所述坐标注意力模块包括依次连接的两个并列的一维全局平均池化层、多通道一维向量拼接层、卷积压缩层、信息编码层、两个并列的通道数调整层、两个并列的Sigmoid函数以及特征加权层,所述特征加权层还与所述坐标注意力模块的输入连接。

6.根据权利要求4所述的多类别汉字单样本字体识别方法,其特征在于,所述多重损失函数包括特征提取损失函数和相似度判别损失函数。

7.根据权利要求6所述的多类别汉字单样本字体识别方法,其特征在于,所述特征提取损失函数为:

8.根据权利要求7所述的多类别汉字单样本字体识别方法,其特征在于,所述相似度判别损失函数为:

9.根据权利要求8所述的多类别汉字单样本字体识别方法,其特征在于,所述多重损失函数为:

...

【技术特征摘要】

1.一种多类别汉字单样本字体识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的多类别汉字单样本字体识别方法,其特征在于,所述步骤s1中,对汉字字体识别模型进行字体识别训练和测试的数据子集xike-cfs-1中的汉字字体包括标准印刷字体中每种字体类别中的两种相似字体、软笔书法字体以及硬笔书法字体;

3.根据权利要求2所述的多类别汉字单样本字体识别方法,其特征在于,所述步骤s2中,所述汉字字体识别模型包括依次连接两个并列的特征提取子网络、特征度量子网络、第三全连接层、第四全连接层以及输出层;

4.根据权利要求3所述的多类别汉字单样本字体识别方法,其特征在于,所述特征提取子网络包括依次连接的第一特征提取模块、坐标注意力模块、第二特征提取模块、第三特征提取模块、第四特征提取模块、全局平均池化层、第一全连接层以及第二...

【专利技术属性】
技术研发人员:闫飞张华
申请(专利权)人:西南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1