一种基于图像数据增强与集成学习的矿物识别方法与系统技术方案

技术编号：40306514 阅读：6 留言：0更新日期：2024-02-07 20:51

本发明专利技术实施例公开了一种基于图像数据增强与集成学习的矿物识别方法与系统，所述方法与系统使用深度卷积生成对抗网络(DCGAN)对真实矿物图像少于2000的矿物生成图像并加入到训练集中，并用扩充了的训练数据训练多个先进图像分类模型进行矿物的分别识别，各识别结果以加权投票法进行集成得到最终识别结果。本发明专利技术解决了矿物训练数据集中各不同种类矿物图像数量的不均衡问题，提高了矿物识别精度，同时集成更多先进模型用于识别矿物图像，进一步提高了矿物识别精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及矿物识别领域，特别是指一种基于图像数据增强与集成学习的具有较高识别率的矿物识别方法与系统。

技术介绍

1、矿物识别是地质研究的重要环节，传统方法大多是鉴定者根据矿物颜色、光泽、纹理以及化学成分等进行判断，存在效率低、过度依赖专家、受主观因素影响等问题。为解决上述问题，已经使用图像分类技术对矿物进行识别，但由于自然界中存在的各矿物数量不同，因此用于训练图像分类模型的数据集中各不同种类矿物图像的数量不均衡，使得矿物识别精度低，亟需对数据集中图像数量少的矿物进行数据增强以提高矿物识别精度，也需要集成先进模型进一步提高矿物识别精度。

技术实现思路

1、为此，本专利技术提供一种基于图像数据增强与集成学习的矿物识别方法与系统，以解决现有识别方法由于矿物数据集中各种类图像数量不平衡以及仅使用单一学习模型而形成的矿物识别精度低的问题。

2、为实现上述目的，本专利技术实施例提供如下技术方案：

3、本专利技术提供一种基于图像数据增强与集成学习的矿物识别方法与系统，其特征在于包括：

4、s1：获得各类真实矿物图像并划分为训练集、验证集及测试集；

5、s2：使用深度卷积生成对抗网络(dcgan)对真实图像少的矿物生成图像并加入到训练集中；

6、s3：使用扩充后的训练集分别训练各先进深度学习模型并获得各模型识别结果，采用加权投票法集成各先进深度学习模型识别结果。

7、进一步的，所述步骤s2“使用深度卷积生成对抗网络(dcg

8、s21：对各类真实矿物图像数量少于2000的矿物用dcgan生成图像；

9、s22：去除生成图像的背景得到反相图；

10、s23：删除不清晰或与矿物极不相似的生成图像；

11、s24：将剩余高质量生成图像加入已有各矿物图像训练集；

12、进一步的，所述步骤s21“对各类真实矿物图像数量少于2000的矿物用dcgan生成图像”具体包括：

13、s211：构造dcgan的生成器g，包括4个倍率为2的二维转置卷积、每个卷积层后是二维批归一化(batch normalization,bn)层和relu激活函数，及1个二维转置卷积和tanh函数；

14、s212：构造dcgan的判别器d，包括4个倍率为2的二维卷积、第1个二维卷积后是leakyrelu激活函数、后3个卷积层后是二维批归一化(batch normalization,bn)层和leakyrelu激活函数，及1个二维卷积和sigmoid函数；

15、s213：以均值为0、标准差为0.2的随机数初始化生成器g和判别器d；

16、s214：使用每类矿物的真实训练图像训练dcgan，共训练5轮，每轮的批量大小为128，每批训练时具体包括：

17、s2141：将该批中的每一个矿物图像x(i)输入判别器d获得输出d(x(i))；

18、s2142：将满足均匀分布的1×100的随机向量z(i)输入生成器g获得

19、生成图像g(z(i))，共批量大小、即128个；

20、s2143：根据目标函数

21、使用adam优化器训练判别器d，其中d(x(i))的标签为1，d(g(z(i)))的标签为0；

22、s2144：根据目标函数使用adam优化器训练生成器g，其中d(g(z(i)))的标签为0；

23、s215：使用训练好的dcgan生成器生成300张该类矿物图像；

24、进一步的，所述步骤s3“使用扩充后的训练集分别训练各先进深度学习模型并获得各模型识别结果，采用加权投票法集成各先进深度学习模型识别结果”具体包括：

25、s31：在imagenet数据上预训练各深度学习模型；

26、s32：使用数据增强后的训练集训练经过预训练的各深度学习模型；

27、s33：获得各深度学习模型在测试集上的精度acci及识别结果resulti；

28、s34：使用加权软投票法集成各深度学习模型结果，即按照公式(1)加权步骤s33中各模型所得的识别结果resulti获得待识别图像是数据集中各矿物的概率，公式(1)中m为s8中使用模型的个数。

29、

30、本专利技术实施例具有如下优点：

31、本专利技术实施例公开了一种基于图像数据增强与集成学习的矿物识别方法与系统，使用dcgan对真实矿物图像少于2000的矿物生成图像并加入到训练集中，解决了训练数据集中各不同种类矿物图像的数量不均衡问题，提高了矿物识别精度，同时集成更多先进模型用于识别矿物图像，进一步提高了矿物识别精度。

本文档来自技高网...

【技术保护点】

1.一种基于图像数据增强与集成学习的矿物识别方法与系统，其特征在于包括：

2.根据权利要求1所述的一种基于图像数据增强与集成学习的矿物识别方法与系统，其特征在于步骤S2“使用深度卷积生成对抗网络(DCGAN)对真实图像少的矿物生成图像并加入到训练集中”包括：

3.根据权利要求2所述的一种基于图像数据增强与集成学习的矿物识别方法与系统，其特征在于步骤S21“对各类真实矿物图像数量少于2000的矿物用DCGAN生成图像”包括：

4.根据权利要求1所述的一种基于图像数据增强与集成学习的矿物识别方法与系统，其特征在于步骤S3“使用扩充后的训练集分别训练各先进深度学习模型并获得各模型识别结果，采用加权投票的方法集成各先进深度学习模型识别结果”包括：

【技术特征摘要】

1.一种基于图像数据增强与集成学习的矿物识别方法与系统，其特征在于包括：

2.根据权利要求1所述的一种基于图像数据增强与集成学习的矿物识别方法与系统，其特征在于步骤s2“使用深度卷积生成对抗网络(dcgan)对真实图像少的矿物生成图像并加入到训练集中”包括：

3.根据权利要求2所述的一种基于图像数据增强与集成学习的矿...

【专利技术属性】
技术研发人员：季晓慧，王琳，杨眉，何明跃，张招崇，王玉柱，曾姗，
申请(专利权)人：中国地质大学北京，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人