甲骨文识别方法、系统、装置和存储介质制造方法及图纸

技术编号:36588413 阅读:25 留言:0更新日期:2023-02-04 17:53
本发明专利技术公开一种甲骨文识别方法、系统、装置和存储介质,应用于甲骨文自动识别和深度学习领域,能较好地识别甲骨文,提高甲骨文识别效率和准确性。该方法包括:获取甲骨文数据集,将甲骨文数据集部分划分为训练集;通过生成对抗网络对训练集进行数据扩增得到训练数据扩增集;通过残差神经网络提取训练数据扩增集的第一特征数据;通过OpenCV提取训练数据扩增集的Gabor特征,卷积得第二特征数据;通过OpenCV提取训练数据扩增集的Hog特征,卷积得第三特征数据;对第一特征数据、第二特征数据和第三特征数据特征融合得第四特征数据;根据第四特征数据和注意力模型计算第五特征数据;将第五特征数据输入全连接层得甲骨文分类结果。特征数据输入全连接层得甲骨文分类结果。特征数据输入全连接层得甲骨文分类结果。

【技术实现步骤摘要】
甲骨文识别方法、系统、装置和存储介质


[0001]本专利技术涉及甲骨文自动识别和深度学习
,尤其涉及一种甲骨文识别方法、系统、装置和存储介质。

技术介绍

[0002]甲骨文是汉字发展的关键形态。由于历史久远,甲骨文研究难度较大,目前甲骨文字的识别仍然主要依靠甲骨文专家、学者的人工处理。而通过人工对甲骨文字识别的效率较为低下。随着深度学习技术的发展,一些方案通过将深度神经网络应用到甲骨文的自动化识别中。相关技术中,大多直接采用迁移学习的方法识别甲骨文,对甲骨文是识别准确率较低,并且识别效率也不高。

技术实现思路

[0003]为了解决上述技术问题的至少之一,本专利技术提出一种甲骨文识别方法、系统、装置和存储介质,能够较好地识别甲骨文,有效提高识别甲骨文的效率和准确性。
[0004]一方面,本专利技术实施例提供了一种甲骨文识别方法,包括以下步骤:
[0005]获取甲骨文数据集,并将所述甲骨文数据集部分划分为训练集;
[0006]通过生成对抗网络对所述训练集进行数据扩增,得到训练数据扩增集;
[0007]根据所述训练数据扩增集,通过残差神经网络提取甲骨文图像的第一特征数据;
[0008]根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,将所述Gabor特征经过卷积操作得到所述甲骨文图像的第二特征数据;
[0009]根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,将所述Hog特征经过卷积操作得到所述甲骨文图像的第三特征数据;
[0010]对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据;
[0011]根据所述第四特征数据和注意力模型,计算得到第五特征数据;
[0012]将所述第五特征数据输入全连接层,得到甲骨文分类结果。
[0013]根据本专利技术实施例的一种甲骨文识别方法,至少具有如下有益效果:将获取的甲骨文数据集部分划分为训练集后,通过生成对抗网络对训练集进行数据扩增,得到训练数据扩增集,能够通过生成对抗网络对训练集数据进行数据扩增,从而使得到的训练数据扩增集的数据质量得到提高。另外,通过残差神经网络提取得到甲骨文的第一特征数据,通过OpenCV提取甲骨文的Gabor特征和Hog特征,并将甲骨文的Gabor特征输入卷积神经网络,提取甲骨文的第二特征数据,另外将甲骨文的Hog特征输入卷积神经网络,提取甲骨文的第三特征数据,然后将第一特征数据、第二特征数据和第三特征数据进行融合从而得到第四特征数据。通过将残差神经网络提取方法和卷积神经网络相结合,从而提高了对甲骨文的特征表达能力和分类效果。进一步地,将第四特征数据结合注意力模型,计算得到第五特征数据,通过注意力机制能够关注到第四特征数据中特征的关键部分,从而较好地识别甲骨文,
有效地提高了识别甲骨文的效率以及准确性。
[0014]根据本专利技术的一些实施例,所述根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,包括:
[0015]根据所述训练数据扩增集,通过Gabor滤波器与所述甲骨文图像进行卷积,得到所述Gabor特征。
[0016]根据本专利技术的一些实施例,所述根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,包括:
[0017]将所述训练数据扩增集进行归一化处理,得到归一化数据集;
[0018]计算所述归一化数据集的图像梯度值;
[0019]构建直方图;
[0020]根据所述直方图,将所述图像梯度值作为权重,对各个梯度方向在所述直方图中加权投影,得到所述直方图每个单元格的描述子;
[0021]将所述每个单元格的描述子进行组合,得到方向梯度直方图特征数据。
[0022]根据本专利技术的一些实施例,所述对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据,包括:
[0023]对所述第二特征数据的特征维度进行转化,得到第二特征转化数据;其中,所述第二特征转化数据的高和宽与所述第一特征数据的高和宽相同;
[0024]对所述第三特征数据的特征维度进行转化,得到第三特征转化数据;其中,所述第三特征转化数据的高和宽与所述第一特征数据的高和宽相同;
[0025]通过增加通道,将所述第二特征转化数据、所述第三特征转化数据与所述第一特征数据拼接,得到第四特征数据。
[0026]根据本专利技术的一些实施例,所述注意力模型包括:通道注意力模型和空间注意力模型;
[0027]所述根据所述第四特征数据和注意力模型,计算得到第五特征数据,包括:将所述第四特征数据输入所述通道注意力模型,得到所述第四特征数据各个通道的对应权重值;
[0028]将所述第四特征数据各个通道的对应权重值与所述第四特征数据各个通道的特征图相乘,得到通道特征数据;
[0029]将所述第四特征数据输入所述空间注意力模型,得到空间注意力权重矩阵;
[0030]将所述空间注意力权重矩阵与所述第四特征数据相乘,得到空间特征数据;
[0031]根据所述通道特征数据和所述空间特征数据,得到第五特征数据。
[0032]根据本专利技术的一些实施例,所述通过生成对抗网络对所述训练集进行数据扩增,得到训练数据扩增集,包括:
[0033]根据循环生成对抗网络,对所述训练集进行数据扩增,得到训练数据扩增集。
[0034]根据本专利技术的一些实施例,所述全连接层包括:第一全连接层和第二全连接层;其中,所述第一全连接层的单元数为500,所述第二全连接层的单元数为所述训练集中甲骨文图像类别数量;
[0035]所述将所述第五特征数据通过全连接层,计算得到甲骨文分类结果,包括:
[0036]将所述第五特征数据依次通过第一全连接层以及第二全连接层,计算得到甲骨文分类结果。
[0037]另一方面,本专利技术实施例还提供了一种甲骨文识别系统,包括:
[0038]数据获取模块,用于获取甲骨文数据集,并将所述甲骨文数据集部分划分为训练集;
[0039]数据扩增模块,用于通过生成对抗网络对所述训练集进行数据扩增,得到训练数据扩增集;
[0040]第一特征提取模块,用于根据所述训练数据扩增集,通过残差神经网络提取甲骨文图像的第一特征数据;
[0041]第二特征提取模块,用于根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,将所述Gabor特征经过卷积操作得到所述甲骨文图像的第二特征数据;
[0042]第三特征提取模块,用于根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,将所述Hog特征经过卷积操作得到所述甲骨文图像的第三特征数据;
[0043]特征融合模块,用于对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据;
[0044]注意力模型处理模块,用于根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种甲骨文识别方法,其特征在于,包括以下步骤:获取甲骨文数据集,并将所述甲骨文数据集部分划分为训练集;通过生成对抗网络对所述训练集进行数据扩增,得到训练数据扩增集;根据所述训练数据扩增集,通过残差神经网络提取甲骨文图像的第一特征数据;根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,将所述Gabor特征经过卷积操作得到所述甲骨文图像的第二特征数据;根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,将所述Hog特征经过卷积操作得到所述甲骨文图像的第三特征数据;对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据;根据所述第四特征数据和注意力模型,计算得到第五特征数据;将所述第五特征数据输入全连接层,得到甲骨文分类结果。2.根据权利要求1所述的甲骨文识别方法,其特征在于,所述根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,包括:根据所述训练数据扩增集,通过Gabor滤波器与所述甲骨文图像进行卷积,得到所述Gabor特征。3.根据权利要求1所述的甲骨文识别方法,其特征在于,所述根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,包括:将所述训练数据扩增集进行归一化处理,得到归一化数据集;计算所述归一化数据集的图像梯度值;构建直方图;根据所述直方图,将所述图像梯度值作为权重,对各个梯度方向在所述直方图中加权投影,得到所述直方图每个单元格的描述子;将所述每个单元格的描述子进行组合,得到方向梯度直方图特征数据。4.根据权利要求1所述的甲骨文识别方法,其特征在于,所述对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据,包括:对所述第二特征数据的特征维度进行转化,得到第二特征转化数据;其中,所述第二特征转化数据的高和宽与所述第一特征数据的高和宽相同;对所述第三特征数据的特征维度进行转化,得到第三特征转化数据;其中,所述第三特征转化数据的高和宽与所述第一特征数据的高和宽相同;通过增加通道,将所述第二特征转化数据、所述第三特征转化数据与所述第一特征数据拼接,得到第四特征数据。5.根据权利要求1所述的甲骨文识别方法,其特征在于,所述注意力模型包括:通道注意力模型和空间注意力模型;所述根据所述第四特征数据和注意力模型,计算得到第五特征数据,包括:将所述第四特征数据输入所述通道注意力模型,得到所述第四特征数据各个通道的...

【专利技术属性】
技术研发人员:陈莹陈锦萍罗添陈远镇甘锦晴朱咏心曹阳
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1