一种不同区域岩性识别模型的无监督自适应方法技术

技术编号：38373076 阅读：17 留言：0更新日期：2023-08-05 17:35

本发明专利技术公开一种不同区域岩性识别模型的无监督自适应方法，首先对源域有岩性标签的岩石图像和目标域无标记岩石图像进行特征提取、降维，并求得初始投影矩阵。使用基于类原型和结构化预测策略对目标域岩石样本进行岩性伪标签预测，同时使用强化学习对目标域带有岩性伪标签的岩石样本进行选择性伪标记；然后通过使用有岩性标记源域数据和强化学习选择出的岩性伪标记目标域数据的局部保留投影来更新投影矩阵，并使用基于类原型和结构化预测策略更新目标域所有数据的岩性伪标记；通过更新投影最终实现不同区域岩性识别模型的领域自适应。本发明专利技术方法提高了未标记数据伪标签和域对齐的准确性。齐的准确性。齐的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种不同区域岩性识别模型的无监督自适应方法

[0001]本专利技术涉及岩性识别模型，尤其涉及一种不同区域岩性识别模型的无监督自适应方法。

技术介绍

[0002]随着人工智能在岩性识别中的应用，领域自适应问题存在于许多实际应用中，作为当前研究的热点和难点备受关注。当需对目标域的无标记的样本进行岩性识别但是有标记样本仅来自源域，且两域的数据分布不同时，若将从源域训练得到的分类模型直接应用于目标域样本时，分类器的性能会出现显著下降。
[0003]无监督领域自适应(UDA)是解决未标记测试样本和标记训练样本来自不用域的问题的有效方法之一。通过减少源域和目标域之间分布差异从而达到迁移学习的目的。主流的无监督域自适应算法主要分为基于样本重要性估计、高阶矩匹配、伪标签以及对抗训练的学习，基于伪标签的无监督域自适应算法试图为目标域的每个实例赋予伪标签,并筛选可信实例实现模型的监督训练。
[0004]传统的伪标记方法很难平衡伪标记数据的准确性和代表性，伪标签中通常包含很多错误标签，若使用错误的标签样本进行训练会对原始模型产生负面影响，且不准确的伪标记也可能会导致学习过程中灾难性的错误累计。因此，通过选择性伪标签策略，选择出最可信的伪标签样本，可增加目标域中伪标记的正确性概率，从而可避免将错误率较高的目标域样本加入到下一次迭代过程中，从而提升目标域样本伪标签的准确率,提升自适应的鲁棒性。
[0005]局部保留投影(LPP)作为一种映射到子空间的方法，已被实验证实在很多应用中可得到比主成分分析以及Fisher线性判...

【技术保护点】

【技术特征摘要】
1.一种不同区域岩性识别模型的无监督自适应方法，其特征在于，包括步骤如下：S1，将含有各类岩性数据的岩石图像数据集进行人工分类处理后赋予岩性标签作为源域数据集；S2，将保存的岩心扫描图片和电镜扫描图片作为目标域数据集；S3，基于源域数据集和目标域数据集，将岩石图片进行预处理后，引入CNN岩性识别模型中的特征提取器F进行特征提取并降维后，利用源域有标记岩石样本求得初始投影P0；S4，在学习子空间中采用基于类原型结合结构化预测方法对目标域所有数据进行岩性伪标记；S5，使用基于强化学习的选择岩性伪标记策略对目标域中最可靠的岩性伪标记样本进行选择；S6，将步骤S5所得岩性伪标签样本和源域有岩性标签样本组成样本集，采用局部保留投影作为使能技术，完成两个域的类对齐任务；S7，采用基于类原型结合结构化预测方法将目标域岩石样本更新为岩性伪标记；S8，重复步骤S5至步骤S7，直至达到目标迭代次数。2.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法，其特征在于，步骤S1中，根据岩性分类，将煤、含砂砾岩、粗砂岩、中砂岩、细砂岩、粉砂岩和泥岩作为岩性标签；其中，含砂砾岩颗粒直径大于2mm、粗砂岩颗粒直径为1～0.5mm、中砂岩颗粒直径为0.5～0.25mm、细砂岩颗粒直径0.25～0.05mm、粉砂岩颗粒直径0.05～0.005mm、泥岩颗粒直径小于0.005mm；煤的颜色为黑色，或灰黑色。3.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法，其特征在于，步骤S1中，将源域中n
s
个含有各类岩性数据的岩石图像数据集进行人工岩性分类标记，作为源域有标记数据集其中表示源域中第i个有标签岩石样本，表示人工标注的岩性标签。4.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法，其特征在于，步骤S2中，将目标域中保存的n
t
个未标记的岩心扫描图片和电镜扫描图片，组成目标域未标记数据集其中表示目标域中第i个无标签岩石样本。5.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法，其特征在于，步骤S3中，岩石图片进行预处理的实现步骤如下：S31，读取源域数据集和目标域数据集中的岩石图像，选取岩石图像中间部分256
×
256像素大小的区域并将大小调整为224
×
224像素，经过归一化和数据增强处理后传输至CNN岩性识别模型的特征提取器F中，特征提取器F根据图像中岩石的颜色、形态、纹理和结构，分别提取与的特征向量：与d表示特征维数；S32，利用局部保留投影对源域与目标域岩石样本特征向量降维，其目标函数表达式为：其中，P为目标函数寻找的投影矩阵；为源域与目标域岩石样本特征向量级
联产生的矩阵；D为对角矩阵相似矩阵M定义为：L＝D
‑
M为拉普拉斯矩阵；根据下式求解最小特征值对应的特征向量：XLX
T
p＝λXDX
T
p最小特征值对应的特征向量为目标函数的最优投影向量；求解得到投影矩阵以及低维特征矩阵式中d1≤d表示降维后的特征空间维数，n＝n
s
+n
t
；S33，将源域有标记岩石样本低维特征向量组成的矩阵带入公式中，求得初始投影矩阵其中d2表示投影子空间维度，且d2＜d1。6.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法，其特征在于，步骤S4中，采用基于类原型结合结构化预测方法对目标域所有岩石样本数据进行岩性伪标记的实现步骤如下：S41，计算源域岩石样本投影：S42，计算目标域岩石样本投影：S43，将源域岩石样本投影z
s
与目标域岩石样本投影z
t
经过集中化与L2归一化，得到所有源域岩石样本和目标域岩石样本投影的平均值z；S44，对目标域岩石样本x
t
进行岩性伪标签预测，表达式如下：其中，p(y|x
t
)＝max{p1(y|x
t

【专利技术属性】
技术研发人员：谢云欣，吴思羽，朱晨阳，金亮钰，
申请(专利权)人：常州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人