当前位置: 首页 > 专利查询>常州大学专利>正文

一种不同区域岩性识别模型的无监督自适应方法技术

技术编号:38373076 阅读:17 留言:0更新日期:2023-08-05 17:35
本发明专利技术公开一种不同区域岩性识别模型的无监督自适应方法,首先对源域有岩性标签的岩石图像和目标域无标记岩石图像进行特征提取、降维,并求得初始投影矩阵。使用基于类原型和结构化预测策略对目标域岩石样本进行岩性伪标签预测,同时使用强化学习对目标域带有岩性伪标签的岩石样本进行选择性伪标记;然后通过使用有岩性标记源域数据和强化学习选择出的岩性伪标记目标域数据的局部保留投影来更新投影矩阵,并使用基于类原型和结构化预测策略更新目标域所有数据的岩性伪标记;通过更新投影最终实现不同区域岩性识别模型的领域自适应。本发明专利技术方法提高了未标记数据伪标签和域对齐的准确性。齐的准确性。齐的准确性。

【技术实现步骤摘要】
一种不同区域岩性识别模型的无监督自适应方法


[0001]本专利技术涉及岩性识别模型,尤其涉及一种不同区域岩性识别模型的无监督自适应方法。

技术介绍

[0002]随着人工智能在岩性识别中的应用,领域自适应问题存在于许多实际应用中,作为当前研究的热点和难点备受关注。当需对目标域的无标记的样本进行岩性识别但是有标记样本仅来自源域,且两域的数据分布不同时,若将从源域训练得到的分类模型直接应用于目标域样本时,分类器的性能会出现显著下降。
[0003]无监督领域自适应(UDA)是解决未标记测试样本和标记训练样本来自不用域的问题的有效方法之一。通过减少源域和目标域之间分布差异从而达到迁移学习的目的。主流的无监督域自适应算法主要分为基于样本重要性估计、高阶矩匹配、伪标签以及对抗训练的学习,基于伪标签的无监督域自适应算法试图为目标域的每个实例赋予伪标签,并筛选可信实例实现模型的监督训练。
[0004]传统的伪标记方法很难平衡伪标记数据的准确性和代表性,伪标签中通常包含很多错误标签,若使用错误的标签样本进行训练会对原始模型产生负面影响,且不准确的伪标记也可能会导致学习过程中灾难性的错误累计。因此,通过选择性伪标签策略,选择出最可信的伪标签样本,可增加目标域中伪标记的正确性概率,从而可避免将错误率较高的目标域样本加入到下一次迭代过程中,从而提升目标域样本伪标签的准确率,提升自适应的鲁棒性。
[0005]局部保留投影(LPP)作为一种映射到子空间的方法,已被实验证实在很多应用中可得到比主成分分析以及Fisher线性判别分析更好的结果。其主要思想是通过使原始空间中相互离得近的点对在降维后的低维空间中也保持较近来保留原始数据的局部结构,不仅可以较好地保留原始数据的结构,还在类内有多个聚类问题中也可得到很好的结果。通过构造出关于投影矩阵的目标函数,将两个域投影到同一子空间中,并在子空间中进行伪标签样本选择。根据迭代策略不断更新投影矩阵,从而减少受分布差异的条件限制,促进两个域的类对齐。

技术实现思路

[0006]专利技术目的:本专利技术的目的是提供一种通过选择性伪标记策略促进精确的岩性伪标记,并提高域对齐准确性的不同区域岩性识别模型的无监督自适应方法。
[0007]技术方案:本专利技术的无监督自适应方法,包括步骤如下:
[0008]S1,将含有各类岩性数据的岩石图像数据集进行人工分类处理后赋予岩性标签作为源域数据集;
[0009]S2,将保存的岩心扫描图片和电镜扫描图片作为目标域数据集;
[0010]S3,基于源域数据集和目标域数据集,将岩石图片进行预处理后,引入CNN岩性识
别模型中的特征提取器F进行特征提取并降维后,利用源域有标记岩石样本求得初始投影P0;
[0011]S4,在学习子空间中采用基于类原型结合结构化预测方法对目标域所有数据进行岩性伪标记;
[0012]S5,使用基于强化学习的选择岩性伪标记策略对目标域中最可靠的岩性伪标记样本进行选择;
[0013]S6,将步骤S5所得岩性伪标签样本和源域有岩性标签样本组成样本集,采用局部保留投影作为使能技术,完成两个域的类对齐任务;
[0014]S7,采用基于类原型结合结构化预测方法将目标域岩石样本更新为岩性伪标记;
[0015]S8,重复步骤S5至步骤S7,直至达到目标迭代次数。
[0016]进一步,步骤S1中,根据岩性分类,将煤、含砂砾岩、粗砂岩、中砂岩、细砂岩、粉砂岩和泥岩作为岩性标签;其中,含砂砾岩颗粒直径大于2mm、粗砂岩颗粒直径为1~0.5mm、中砂岩颗粒直径为0.5~0.25mm、细砂岩颗粒直径0.25~0.05mm、粉砂岩颗粒直径0.05~0.005mm、泥岩颗粒直径小于0.005mm;煤的颜色为黑色、灰黑色。
[0017]进一步,步骤S1中,将源域中n
s
个含有各类岩性数据的岩石图像数据集进行人工岩性分类标记,作为源域有标记数据集其中表示源域中第i个有标签岩石样本,表示人工标注的岩性标签。
[0018]进一步,步骤S2中,将目标域中保存的n
t
个未标记的岩心扫描图片和电镜扫描图片,组成目标域未标记数据集其中表示目标域中第i个无标签岩石样本。
[0019]进一步,步骤S3中,岩石图片进行预处理的实现步骤如下:
[0020]S31,读取源域数据集和目标域数据集中的岩石图像,选取岩石图像中间部分256
×
256像素大小的区域并将大小调整为224
×
224像素,经过归一化和数据增强处理后传输至CNN岩性识别模型的特征提取器F中,特征提取器F根据图像中岩石的颜色、形态、纹理和结构,分别提取与的特征向量:与d表示特征维数;
[0021]S32,利用局部保留投影对源域与目标域岩石样本特征向量降维,其目标函数表达式为:
[0022][0023]其中,P为目标函数寻找的投影矩阵;
[0024]为源域与目标域岩石样本特征向量级联产生的矩阵;
[0025]D为对角矩阵相似矩阵M定义为:
[0026][0027]L=D

M为拉普拉斯矩阵;
[0028]根据下式求解最小特征值对应的特征向量:
[0029]XLX
T
p=λXDX
T
p
[0030]最小特征值对应的特征向量为目标函数的最优投影向量;
[0031]求解得到投影矩阵以及低维特征矩阵式中d1≤d表示降维后的特征空间维数,n=n
s
+n
t

[0032]S33,将源域有标记岩石样本低维特征向量组成的矩阵带入公式中,求得初始投影矩阵其中d2表示投影子空间维度,且d2<d1。
[0033]进一步,步骤S4中,采用基于类原型结合结构化预测方法对目标域所有岩石样本数据进行岩性伪标记的实现步骤如下:
[0034]S41,计算源域岩石样本投影:
[0035][0036]S42,计算目标域岩石样本投影:
[0037][0038]S43,将源域岩石样本投影z
s
与目标域岩石样本投影z
t
经过集中化与L2归一化,得到所有源域岩石样本和目标域岩石样本投影的平均值z;
[0039]S44,对目标域岩石样本x
t
进行岩性伪标签预测,表达式如下:
[0040][0041]其中,p(y|x
t
)=max{p1(y|x
t
),p2(y|x
t
)};
[0042][0043]其中,|У
集合
|表示岩石类别的数量;表示y类岩性的类原型,是岩性标签为y的源域岩石样本投影的平均向量,表达式如下:
[0044][0045]当y=y
i
时,否则,
[0046][0047]其中,表示与y类对应的聚类中心;
[0048]对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种不同区域岩性识别模型的无监督自适应方法,其特征在于,包括步骤如下:S1,将含有各类岩性数据的岩石图像数据集进行人工分类处理后赋予岩性标签作为源域数据集;S2,将保存的岩心扫描图片和电镜扫描图片作为目标域数据集;S3,基于源域数据集和目标域数据集,将岩石图片进行预处理后,引入CNN岩性识别模型中的特征提取器F进行特征提取并降维后,利用源域有标记岩石样本求得初始投影P0;S4,在学习子空间中采用基于类原型结合结构化预测方法对目标域所有数据进行岩性伪标记;S5,使用基于强化学习的选择岩性伪标记策略对目标域中最可靠的岩性伪标记样本进行选择;S6,将步骤S5所得岩性伪标签样本和源域有岩性标签样本组成样本集,采用局部保留投影作为使能技术,完成两个域的类对齐任务;S7,采用基于类原型结合结构化预测方法将目标域岩石样本更新为岩性伪标记;S8,重复步骤S5至步骤S7,直至达到目标迭代次数。2.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法,其特征在于,步骤S1中,根据岩性分类,将煤、含砂砾岩、粗砂岩、中砂岩、细砂岩、粉砂岩和泥岩作为岩性标签;其中,含砂砾岩颗粒直径大于2mm、粗砂岩颗粒直径为1~0.5mm、中砂岩颗粒直径为0.5~0.25mm、细砂岩颗粒直径0.25~0.05mm、粉砂岩颗粒直径0.05~0.005mm、泥岩颗粒直径小于0.005mm;煤的颜色为黑色,或灰黑色。3.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法,其特征在于,步骤S1中,将源域中n
s
个含有各类岩性数据的岩石图像数据集进行人工岩性分类标记,作为源域有标记数据集其中表示源域中第i个有标签岩石样本,表示人工标注的岩性标签。4.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法,其特征在于,步骤S2中,将目标域中保存的n
t
个未标记的岩心扫描图片和电镜扫描图片,组成目标域未标记数据集其中表示目标域中第i个无标签岩石样本。5.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法,其特征在于,步骤S3中,岩石图片进行预处理的实现步骤如下:S31,读取源域数据集和目标域数据集中的岩石图像,选取岩石图像中间部分256
×
256像素大小的区域并将大小调整为224
×
224像素,经过归一化和数据增强处理后传输至CNN岩性识别模型的特征提取器F中,特征提取器F根据图像中岩石的颜色、形态、纹理和结构,分别提取与的特征向量:与d表示特征维数;S32,利用局部保留投影对源域与目标域岩石样本特征向量降维,其目标函数表达式为:其中,P为目标函数寻找的投影矩阵;为源域与目标域岩石样本特征向量级
联产生的矩阵;D为对角矩阵相似矩阵M定义为:L=D

M为拉普拉斯矩阵;根据下式求解最小特征值对应的特征向量:XLX
T
p=λXDX
T
p最小特征值对应的特征向量为目标函数的最优投影向量;求解得到投影矩阵以及低维特征矩阵式中d1≤d表示降维后的特征空间维数,n=n
s
+n
t
;S33,将源域有标记岩石样本低维特征向量组成的矩阵带入公式中,求得初始投影矩阵其中d2表示投影子空间维度,且d2<d1。6.根据权利要求1所述不同区域岩性识别模型的无监督自适应方法,其特征在于,步骤S4中,采用基于类原型结合结构化预测方法对目标域所有岩石样本数据进行岩性伪标记的实现步骤如下:S41,计算源域岩石样本投影:S42,计算目标域岩石样本投影:S43,将源域岩石样本投影z
s
与目标域岩石样本投影z
t
经过集中化与L2归一化,得到所有源域岩石样本和目标域岩石样本投影的平均值z;S44,对目标域岩石样本x
t
进行岩性伪标签预测,表达式如下:其中,p(y|x
t
)=max{p1(y|x
t

【专利技术属性】
技术研发人员:谢云欣吴思羽朱晨阳金亮钰
申请(专利权)人:常州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1