一种基于注意力模块增强的CNN楷体书法风格分类方法技术

技术编号:29293732 阅读:25 留言:0更新日期:2021-07-17 00:42
本发明专利技术公开的一种基于注意力模块增强的CNN楷体书法风格分类方法,具体为:步骤1、获取四种不同书法风格的图像,组成数据集并分成训练样本和测试样本;步骤2、组成卷积块结构;步骤3、组成基线模型;步骤4、向步骤3构造的基线模型中的第三个卷积块与第四个卷积块之间嵌入第一个CBAM、第四个卷积块与Flatten层之间嵌入第二个CBAM形成组合模型;步骤5、设置损失函数和训练参数,将步骤1数据集中的训练样本与测试样本输入到步骤4构造的组合模型,进行训练与测试;步骤6、将步骤5中训练结果中测试准确率最高的模型保存下来。该方法解决了现有技术中存在的书法风格分类困难的问题,并提高分类的精准度。分类的精准度。分类的精准度。

【技术实现步骤摘要】
一种基于注意力模块增强的CNN楷体书法风格分类方法


[0001]本专利技术属于人工智能
,具体涉及一种基于注意力模块增强的CNN楷体书法风格分类方法。

技术介绍

[0002]中国书法作品是文化瑰宝,具有重要的研究价值。与中国书法字体相比,不同风格的特征对于外行人来说更难识别,例如,对于五种书法字体:篆书,隶书,楷书,行书,草书来说,它们的外形具有较为明显的差异,容易被人们分辨出来。然而,我国古代四位著名书法家,欧阳询,颜真卿,柳公权,赵孟頫创作的作品欧体,颜体,柳体,赵体都属于楷书,它们之间外形上的差异就要比五种字体之间的差异小很多,因此书法风格的分类是一项重要而具有挑战性的任务。本专利技术为了将四种楷体书法风格,欧体,颜体,柳体,赵体进行更高精度的分类,提出一种基于注意力模块增强的卷积神经网络的书法图像风格分类方法。该分类模型的提出不仅可以自动分类欧体,颜体,柳体,赵体这四种风格的书法图像,还可以为将来的下游视觉任务提供帮助,如目标识别等。

技术实现思路

[0003]本专利技术的目的是提供一种基于注意力模块增强的CNN楷本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,具体按照以下步骤实施:步骤1、获取四种不同书法风格的图像,组成数据集并分成训练样本和测试样本;步骤2、构建由卷积层,池化层,批量归一化层和非线性层组成的卷积块结构;步骤3、将一个Dropout层、四个步骤2构造的卷积块、一个Flatten层及一个全连接层顺序排列在一起组成基线模型;步骤4、向步骤3构造的基线模型中的第三个卷积块与第四个卷积块之间嵌入第一个CBAM、第四个卷积块与Flatten层之间嵌入第二个CBAM形成组合模型;步骤5、设置损失函数和训练参数,将步骤1数据集中的训练样本与测试样本输入到步骤4构造的组合模型,进行训练与测试,训练每经过1个epoch,会在测试集上测试一遍当前网络的分类准确率,这个过程由设置的训练参数自动控制完成;步骤6、将步骤5中训练结果中测试准确率最高的模型保存下来,作为书法风格分类模型,即为最终得到的书法风格分类器。2.根据权利要求1所述的一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,步骤1具体按照以下步骤实施:步骤1.1、利用现有的最小包围盒切算法从欧体,颜体,柳体及赵体四不同书法风格的整幅楷书作品中分割出单个字符图像,每种风格的书法字符图像数量相等;步骤1.2、从步骤1.1中获得的每种风格的书法字符图像中,按照3:1的比例分成训练集和测试集待用。3.根据权利要求1所述的一种基于注意力模块增强的CNN楷体书法风格分类方法,其特征在于,步骤2具体为:按照顺序将卷积层,最大池化层,批量归一层和非线性层排列在一起,并将它们封装在一个卷积块中;其中,卷积层的滤波器大小为5
×
5,步长为1;最大...

【专利技术属性】
技术研发人员:张九龙于文航屈小娥
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1