一种用于古钱币的细粒度图像分类方法及装置制造方法及图纸

技术编号：41295462 阅读：2 留言：0更新日期：2024-05-13 14:44

本发明专利技术公开了一种用于古钱币的细粒度图像分类方法及装置，涉及古钱币分类技术领域。首先对钱币图像进行预处理，得到无额外文字干扰、图像尺寸、灰度值相同且带有完整性标签的预处理数据；在训练过程中减少信息缺失的钱币图像的权重，从而不至于完全丢失信息，同时又能减少磨损带来的干扰；融合钱币的正反面特征信息作为钱币最终特征，最后对钱币进行细粒度的分类，选用top‑k方法计算相似度，将其分类到多个小类别上。本发明专利技术提供的一种用于古钱币的细粒度图像分类方法及装置，充分利用了钱币的正反面信息，减轻了受损图片的影响，提高了模型在细粒度分类上的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及古钱币分类，特别涉及一种用于古钱币的细粒度图像分类方法及装置。

技术介绍

1、随着人工智能的不断发展和突破，图像分类任务已经取得了显著的进展。在传统的图像分类中，首先需要进行大量数据的采集，以确保系统能够学习到多样性和广泛性。对于古钱币图像分类而言，这意味着收集包含不同年代、地域和金属质地的古钱币图像，以构建丰富的训练数据集。随后，对这些数据进行预处理，包括图像尺寸调整、灰度化和归一化，以确保输入数据的一致性和标准化。

2、近年来深度学习技术，尤其是卷积神经网络(cnn)，通过学习图像中的层次化特征，cnn能够自动学习到图像中的关键特征，无需依赖领域专家手动选择和提取特征，大大提高了图像分类的效率和准确性。在模型选择方面，传统方法包括支持向量机(svm)、决策树和k最近邻(knn)等。然而，随着深度学习技术的发展，深度学习模型，尤其是卷积神经网络，成为图像分类任务中的主流选择，因其在端到端学习方面的优势。这些模型通过大量训练数据自动调整参数，使其能够更好地适应各种图像分类任务。

3、但是大多数现有的钱币分类方法往往将钱币的正反面一起处理，忽略了正反面信息的差异性，这可能限制了对于古钱币图像的全面理解和分类准确性。在现实中，古钱币的大小可能因时代和地域而异，而且图像的背景可能存在各种干扰(如空白区域的面积)。现有的方法对于不一致的尺寸和背景难以处理，影响古钱币分类的准确性。此外现有的方法对于古钱币分类的粒度较粗，只做到金币、银币、纸币等层面，现实世界的应用场景较小。

>技术实现思路

1、本专利技术要解决的技术问题，在于提供一种用于古钱币的细粒度图像分类方法及装置，充分利用了钱币的正反面信息，利用完整性标签来标注信息缺失的钱币图像，并通过训练不同的权重，提高模型在细粒度分类上的表现。

2、第一方面，本专利技术提供了一种用于古钱币的细粒度图像分类方法，包括：

3、数据预处理过程：对钱币图像进行预处理，对于只有正面或者只有反面的钱币图像，利用与平均灰度值相同的灰度图片替代缺失的部分，根据图像信息的完整性设置标签，得到无额外文字干扰、图像尺寸、灰度值相同且带有完整性标签的预处理数据；

4、分类模型训练过程：构建深度学习分类模型，包括两个嵌入层、标签判别器以及特征融合单元，两个嵌入层用于分别对正面和反面钱币图像进行特征学习，标签判别器用于根据完整性标签选择权重，特征融合单元用于将钱币的正面特征信息和反面特征信息按指定权重进行融合；利用预处理数据训练模型至损失最小化，得到钱币特征库；

5、细粒度分类过程：将预处理后的待分类钱币的正反面作为两张图像输入到模型中，得到融合了正反面特征的结果作为钱币最终特征；将钱币最终特征与钱币特征库中的特征进行相似度匹配，将前k个相似度得分最高的类别作为最终分类结果。

6、进一步地，所述数据预处理过程具体包括：

7、利用ocr检测钱币图像中是否存在文字，若存在文字且文字在非钱币的区域上，则进行清洗操作，去除文字部分；

8、计算钱币图像的平均高度、平均宽度以及平均灰度值，将所有钱币图像的尺寸调整成平均值，灰度值调整成平均值，以确保输入数据的一致性和标准化；

9、对于只有正面或者只有反面的图像，利用与平均灰度值相同的灰度图片替代缺失的部分；

10、根据图像信息的完整性设置标签；

11、最后得到无额外文字干扰、图像尺寸、灰度值相同且带有完整性标签的预处理数据。

12、进一步地，所述深度学习分类模型的损失函数为：

13、

14、其中，m为完整性标签，图像信息完整取值为0、图像信息不完整取值为1；k为钱币数据集中正常数据的类别数；n为钱币数据集中所有数据的类别数；a为可学习权重，用于减轻信息缺失的钱币带来的噪音；yc为钱币图像的符号函数，为钱币图像的预测函数。

15、进一步地，正反面特征信息融合时，正面特征信息的权重大于反面特征信息的权重，且正面特征信息的权重与反面特征信息的权重之和为1。

16、进一步地，正面特征信息的权重为0.55，反面特征信息的权重为0.45，正反面特征信息融合的计算公式如下：

17、embt＝0.55·embfront+0.45·embback

18、其中，embfront为正面特征信息，embback为反面特征信息。

19、第二方面，本专利技术提供了一种用于古钱币的细粒度图像分类装置，包括：数据预处理模块、分类模型训练模块以及细粒度分类模块；其中，

20、数据预处理模块，用于对钱币图像进行预处理，对于只有正面或者只有反面的钱币图像，利用与平均灰度值相同的灰度图片替代缺失的部分，根据图像信息的完整性设置标签，得到无额外文字干扰、图像尺寸、灰度值相同且带有完整性标签的预处理数据；

21、分类模型训练模块，用于构建深度学习分类模型，包括两个嵌入层、标签判别器以及特征融合单元，两个嵌入层用于分别对正面和反面钱币图像进行特征学习，标签判别器用于根据完整性标签选择权重，特征融合单元用于将钱币的正面特征信息和反面特征信息按指定权重进行融合；利用预处理数据训练模型至损失最小化，得到钱币特征库；

22、细粒度分类模块，用于将预处理后的待分类钱币的正反面作为两张图像输入到模型中，得到融合了正反面特征的结果作为钱币最终特征；将钱币最终特征与钱币特征库中的特征进行相似度匹配，将前k个相似度得分最高的类别作为最终分类结果。

23、进一步地，所述数据预处理模块具体用于：

24、利用ocr检测钱币图像中是否存在文字，若存在文字且文字在非钱币的区域上，则进行清洗操作，去除文字部分；

25、计算钱币图像的平均高度、平均宽度以及平均灰度值，将所有钱币图像的尺寸调整成平均值，灰度值调整成平均值，以确保输入数据的一致性和标准化；

26、对于只有正面或者只有反面的图像，利用与平均灰度值相同的灰度图片替代缺失的部分；

27、根据图像信息的完整性设置标签；

28、最后得到无额外文字干扰、图像尺寸、灰度值相同且带有完整性标签的预处理数据。

29、进一步地，所述深度学习分类模型的损失函数为：

30、

31、其中，m为完整性标签，图像信息完整取值为0、图像信息不完整取值为1；k为钱币数据集中正常数据的类别数；n为钱币数据集中所有数据的类别数；a为可学习权重，用于减轻信息缺失的钱币带来的噪音；yc为钱币图像的符号函数，为钱币图像的预测函数。

32、进一步地，正反面特征信息融合时，正面特征信息的权重大于反面特征信息的权重，且正面特征信息的权重与反面特征信息的权重之和为1。

33、进一步地，正面特征信息的权重为0.55，反面特征信息的权重为0.45，正反面特征信息融合的计算公式如下：

34、embt＝0.55·embfront本文档来自技高网...

【技术保护点】

1.一种用于古钱币的细粒度图像分类方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于：所述数据预处理过程具体包括：

3.根据权利要求1所述的方法，其特征在于：所述深度学习分类模型的损失函数为：

4.根据权利要求1所述的方法，其特征在于：正反面特征信息融合时，正面特征信息的权重大于反面特征信息的权重，且正面特征信息的权重与反面特征信息的权重之和为1。

5.根据权利要求4所述的方法，其特征在于：正面特征信息的权重为0.55，反面特征信息的权重为0.45，正反面特征信息融合的计算公式如下：

6.一种用于古钱币的细粒度图像分类装置，其特征在于，包括：数据预处理模块、分类模型训练模块以及细粒度分类模块；其中，

7.根据权利要求6所述的装置，其特征在于：所述数据预处理模块具体用于：

8.根据权利要求6所述的装置，其特征在于：所述深度学习分类模型的损失函数为：

9.根据权利要求6所述的装置，其特征在于：正反面特征信息融合时，正面特征信息的权重大于反面特征信息的权重，且正面特征信息的权

10.根据权利要求9所述的装置，其特征在于：正面特征信息的权重为0.55，反面特征信息的权重为0.45，正反面特征信息融合的计算公式如下：

...

【技术特征摘要】

1.一种用于古钱币的细粒度图像分类方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于：所述数据预处理过程具体包括：

3.根据权利要求1所述的方法，其特征在于：所述深度学习分类模型的损失函数为：

5.根据权利要求4所述的方法，其特征在于：正面特征信息的权重为0.55，反面特征信息的权重为0.45，正反面特征信息融合的计算公式如下：

6.一种用于古钱币的细粒...

【专利技术属性】
技术研发人员：郑薇玮，赵一聪，李直旭，郑斌，陈星娥，吴小菁，张林友，徐戈，
申请(专利权)人：福建江夏学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人