【技术实现步骤摘要】
基于ViT框架的多类目岩矿快速分类方法、设备及存储介质
[0001]本专利技术涉及自然岩矿图像识别
,尤其涉及一种基于ViT框架的多类目岩矿快速分类方法、设备及存储介质。
技术介绍
[0002]自然岩矿识别与分类能提高野外岩矿勘探提供更高效的辅助,对不同环境下对岩矿样本的类别识别以及非专业人士了解岩矿知识有重要意义。
[0003]一般来讲,传统的自然岩矿识别需要专业人员通过实物或者多方面图像信息进行识别与分类,这种人工识别的方式,一方面需要耗费大量时间,另一方面对鉴定人员的相关知识也有较高的要求。
[0004]近年来自然岩矿图像领域的识别技术进展有卓越的成果,引入深度学习方法后进一步提高了自动化识别岩矿类别的效率,可以更具图像特征对自然岩矿图像进行类别判别。但自然岩矿图像与其他图像不同,自然岩矿来源于自然环境,存在更加复杂多变的干扰因素,比如光照亮度、拍摄角度、目标在图像中的占比、图像的清晰程度、样本表面杂质的覆盖比例等等,相对比专业的岩矿切片图像,存在更多的冗余与干信息,进而导致在多较多类别的岩矿自然 ...
【技术保护点】
【技术特征摘要】
1.一种基于ViT框架的多类目岩矿快速分类方法,其特征在于,建立自然岩矿图像识别模型进行多类目岩矿快速分类,所述方法包括以下步骤:S1,采集岩矿图像数据集样本输入至自然岩矿图像识别模型的预处理模块,进行特征预提取和抑制过拟合处理,所述数据集样本包括图像数据以及与其对应的类别标签,继续执行步骤S2;S2,将经过预处理模块的数据集样本输入至自然岩矿图像识别模型的数据处理模块中进行参数训练和Token提取,继续执行步骤S3;S3,自然岩矿图像识别模型的结果处理模块根据所述参数训练和Token提取结果进行Token分离和类别映射并输出分类结果,完成对所述自然岩矿图像识别模型的训练;继续执行步骤S4;S4,获取待识别图像数据并输入至所述自然岩矿图像识别模型,完成对所述待识别图像数据的分类并输出结果。2.如权利要求1所述的一种基于ViT框架的多类目岩矿快速分类方法,其特征在于,所述自然岩矿图像识别模型中,所述预处理模块包括:顺次连接的输入层、图像统一格式预处理模块、迁移模型、ECTG模块、Dropout层;所述数据处理模块包括:顺次连接的参数正则化层、Mlti
‑
Head Attention模块、Linear层、ECTG模块、Linear+Dropout层、参数正则化层、Linear+GeLU层、Dropout+Linear层、Dropout+Linear层、STFE模块、Linear层;所述结果处理模块包括:顺次连接的参数正则化层、ECTG模块、RCLinear+Softmax层。3.如权利要求2所述的一种基于ViT框架的多类目岩矿快速分类方法,其特征在于,所述步骤S1具体包括:S1
‑
1,所述数据集样本进入自然岩矿图像识别模型的输入层后,所述图像统一格式预处理模块对所述图像数据进行统一尺寸和色彩空间的处理,并输入到迁移模型进行特征预提取,继续执行步骤S1
‑
2;S1
‑
2,所述迁移模型的输出映射层输出所述图像数据的特征,输入至ECTG模块进行类标志Token提取,通过Dropout层抑制过拟合,输出与图像数据对应的标志Token,记为Token T;所述ECTG模块,包括顺次连接的Linear层、Dropout层以及Linear层,第一层Linear层用于映射所述特征,使用GeLU函数激活,再通过Dropout层抑制过拟合,第二层Linear层将所述特征映射为Patch Number倍编码长度后输出,其中Patches Number表示通过预设分割Patches大小计算得出的实际Patches数目。4.如权利要求3所述的一种基于ViT框架的多类目岩矿快速分类方法,其特征在于,所述Token T具体包括:所述Token为通过ECTG模块将n个Patches的特征融合到第0个Patch中,生成与Patch同等大小的Token T:
其中,F为特征值序列矩阵,f
i
为矩阵F的第i个向量,W为训练后的权重参数矩阵,W
j
为矩阵W的第j个向量,B为偏置参数矩阵,B
i
为矩阵B的第i个向量,dim为Patch的尺寸。5.如权利要求3所述的一种基于ViT框架的多类目岩矿快速分类方法,其特征在于,所述步骤S2具体包括:S2
‑
1,所述预处理模块输出的映射为Patch Number倍编码长度的特征经过所述数据处理模块中的参数正则化层进行归一化处理,输入至多个P
‑
Attention组成的Mlti
‑
Head Attention模块,得到输出数据,不同的P
‑
Attention为识别提供一种图像注意力的侧重区域,继续执行步骤S2
‑
2;S2
‑
2,通过Linear层进行参数形状的重新排列,得到每一个图像数据中每一个Patch的特征值,通过ECTG模块执行与步骤S1
‑
2相同的处理以更新Token T,继续执行步骤S2
‑
3;S2
...
【专利技术属性】
技术研发人员:林伟华,刘福江,黎卓武,郭艳,李鹏,周季,唐家玉,孙煜文,
申请(专利权)人:武汉图歌信息技术有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。