一种基于卷积神经网络和自注意力机制的智能矿物分选方法技术

技术编号:38156913 阅读:13 留言:0更新日期:2023-07-13 09:26
本发明专利技术公开了一种基于卷积神经网络和自注意力机制的智能矿物分选方法,实现了高精度、高效率、低体积、低计算复杂度的智能矿物分选。该架构通过结合卷积运算中局部性、平移不变性的归纳偏执和自注意力机制的全局性及长距离依赖性,建立了识别能力更强、特征捕获能力更优的矿物图像分类模型,相较于单一基于卷积神经网络或基于自注意力机制的网络,本发明专利技术提出的架构有着更高的分类精度和更低的计算复杂度。其次,本发明专利技术所提供的架构适用于多种类、多类别矿物图像的细粒度分类任务,对表观特征差异较小的矿物图像有着优异的判别能力。特征差异较小的矿物图像有着优异的判别能力。特征差异较小的矿物图像有着优异的判别能力。

【技术实现步骤摘要】
一种基于卷积神经网络和自注意力机制的智能矿物分选方法


[0001]本专利技术涉及一种基于卷积神经网络和自注意力机制的智能矿物分选方法,名为OreFormer,属于矿物分选和计算机视觉


技术介绍

[0002]矿产资源是现代工业生产的中流砥柱,对经济发展、基础建设、国防安全等作出了巨大贡献。合理、高效且可持续化的矿产资源分配是当前矿业领域发展的第一要务。随着发展速度的不断加快,矿产保有量呈明显下降趋势,且具有贫、细、杂、难选的矿产资源特质。同时,矿物开采过程中围岩量剧增也导致运输、破碎、磨矿能耗居高不下,因此亟须在开采后和洗选前进行矿物快速识别与分选,以达到预先排矸和降本增效的目的。
[0003]近年来,基于射线传感器的智能矿物分选技术备受关注,可实现两产品(矿石排矸)乃至多产品的高效率、批量化分选。同时,随着传感器设备的快速更新,基于γ射线,罗曼光谱分析、X射线衍射(XRD)分析和X射线荧光(XRF)分析的射线分选设备在智能矿物分选领域的应用前景日益广阔,具有精度高、操作简单、用户友好等优点,且在大块矿物的分选任务中效果突出。然而,该类智能矿物分选设备仍受制于价格昂贵、设备成本高、辐射危害性大和设备体积庞大等问题,故不适合于作为一种通用矿物分选技术被应用在实践作业场景。
[0004]成像技术和计算机视觉技术的快速发展为上述问题的解决提供了一种新的解决方案,其借助光学仪器(如工业相机、高光谱成像仪、显微成像系统和扫描电镜)采集矿物图像,并采用图像处理与分析方法对矿物的颜色、光泽、条痕、沟壑、纹理等表观特征进行分析,有效地替代了基于射线传感器的矿物分选设备。早期,基于视觉的矿物分选设备多以传统机器学习算法为核心,如决策树、朴素贝叶斯、K最近邻、人工神经网络、主成分分析、支持向量机等,具有识别速度快、分类精度高、无辐射、无污染、低成本、易部署等优势。然而,图像像素需求高、提取特征有限、推理速度慢且无法充分利用大批量图像数据等缺点仍然限制了该类技术的进一步发展。
[0005]深度学习技术的出现为计算机视觉在选矿领域的交叉整合提供了新的技术发展方向。作为一种数据驱动的技术(即数据量越大或数据分析越充足就能得到越高的精度),其能够充分利用静态或动态场景下采集的大批量矿物图像数据中提取具有代表性、一般性和差异性的特征来完成矿物分选任务。一方面,基于深度学习技术的矿物分选方法继承了传统机器学习方法的高精度、高效率、低成本、低复杂度等应用优势,另一方面又有效地降低了对输入图像分辨率的依赖和推理速度上的局限性。上述因素共同促进了深度学习技术在智能矿物分选领域的发展潜力。现阶段,矿物分选研究人员已经就模型的选择与搭建、多尺度特征的提取与优化、模型的部署与轻量化,以及复杂严峻情景下深度学习技术的应用问题展开了充分探索,这为后续技术的创新奠定了基础。然而,现有研究多基于单一卷积神经网络架构展开。该类网络虽通过卷积运算为特征的提取过程引入了局部性和平移不变性的归纳偏执,但其仍未充分地利用矿物图像的全局性信息,这为分选精度的进一步提升带
来阻碍。此外,全局信息的缺失也使得卷积神经网络架构在矿物图像特征表征层面存在瓶颈。以上问题均需要在架构设计层面进行解决,以有效提高智能矿物分选技术的工业应用性能。

技术实现思路

[0006]有鉴于此,本专利技术提供了一种基于卷积神经网络和自注意力机制的智能矿物分选方法,名为OreFormer,该架构在经过模型训练后可以直接被部署在矿物分选现场,实现矿物的高精度、快速分选。
[0007]一种基于卷积神经网络和自注意力机制的智能矿物分选方法,包括以下步骤:
[0008]步骤1:获取待处理的矿物图像数据,按照比例8:2划分训练集和验证集;
[0009]步骤2:采用人工标注的方法对所述的步骤1获得的矿物图像数据进行标注,以获取矿物图像数据的标签;
[0010]步骤3:搭建步骤1获得的矿物图像数据和步骤2获取的矿物图像数据标签的基于卷积神经网络和自注意力机制的矿物图像分类模型;
[0011]步骤4:对步骤3搭建的基于卷积神经网络和自注意力机制的矿物图像分类模型进行训练;
[0012]步骤5:终止所述矿物图像分类模型的训练过程,得到所述训练后的基于卷积神经网络和自注意力机制的矿物图像分类模型;
[0013]步骤6:通过步骤5获得的基于卷积神经网络和自注意力机制的矿物图像分类模型对新采集的矿物图像数据进行预测,完成矿物分选任务。
[0014]所述的步骤1中,获取矿物图像数据时,搭建矿物图像数据采集平台;所述的矿物图像数据是在工业相机在传送带正上方拍摄的,按照比例8:2划分训练集和验证集;
[0015]所述步骤3中,基于卷积神经网络和自注意力机制的矿物图像分类模型包括卷积颈、下采样层、自注意力编码器、均值池化层、投影层和分类器;
[0016]其中,卷积颈由3个卷积层构成,负责引入卷积运算的归纳偏执;
[0017]下采样层由1个卷积层构成,负责降低特征图像维度并生成用于自注意力编码器特征运算的特征数据;
[0018]自注意力编码器由1个卷积层、2个层归一化层、1个卷积多头自注意力模块(包含1个深度卷积层、3个线性投影层和1个多头自注意力层)、1个倒置瓶颈前馈神经网络(包含3个卷积层)和3条残差连接构成,负责计算输入图像中各区域的注意力权重;
[0019]投影层由1个卷积层构成,负责整合前序网络所提取到的矿物图像特征信息,并将输出传输给分类器;
[0020]分类器由1个全连接层构成,负责建立特征信息与类别之间的关系,进而完成矿物图像分类任务。
[0021]卷积颈包含1个步长为2、卷积核大小为3
×
3的卷积层和2个步长为1、卷积核大小为3
×
3的卷积层;
[0022]下采样层由一个步长为2、卷积核大小为2
×
2的卷积层构成;
[0023]自注意力编码器包含一个步长为1、卷积核大小为3
×
3的深度卷积层及深度卷积层前后的残差连接;1个层归一化层和1个卷积多头自注意力模块及层归一化层之前至卷积
多头自注意力之后的残差连接;1个层归一化层和1个倒置瓶颈前馈神经网络及层归一化层之前至倒置瓶颈前馈神经网络之后的残差连接;
[0024]深度卷积层中每一个卷积核负责在输入图像中的一个通道内进行卷积运算且卷积核数量与输入图像通道数量相等;
[0025]层归一化层将输入特征值按照层级结构进行归一化处理;
[0026]卷积多头自注意力结构包括步长为k、卷积核大小为k
×
k的深度卷积层、线性投影层和多头自注意力层,负责计算输入图像中各区域的注意力权重;
[0027]倒置瓶颈前馈神经网络包括1个步长为1、卷积核大小为1
×
1的卷积层,1个步长为1、卷积核大小为3
×
3的深度卷积层和1个步长为1、卷积核大小为1
×
1的卷积层,负责本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络和自注意力机制的智能矿物分选方法,其特征在于包括以下步骤:步骤1:获取待处理的矿物图像数据,并将获取的矿物图像数据划分为训练集和验证集;步骤2:对步骤1获得的矿物图像数据进行标注,获取矿物图像数据的标签;步骤3:根据步骤1获得的矿物图像数据和步骤2获取的矿物图像数据标签,构建基于卷积神经网络和自注意力机制的矿物图像分类模型;步骤4:使用步骤1中划分的训练集和验证集对步骤3构建的基于卷积神经网络和自注意力机制的矿物图像分类模型进行训练;步骤5:终止所述矿物图像分类模型的训练过程,得到所述训练后的基于卷积神经网络和自注意力机制的矿物图像分类模型;步骤6:通过步骤5获得的基于卷积神经网络和自注意力机制的矿物图像分类模型对新采集的矿物图像数据进行预测,完成矿物分选。2.根据权利要求1所述的一种基于卷积神经网络和自注意力机制的智能矿物分选方法,其特征在于:所述的步骤1中,获取矿物图像数据时,搭建矿物图像数据采集平台;所述的矿物图像数据是在工业相机在传送带正上方拍摄的,按照比例8:2划分训练集和验证集。3.根据权利要求1或2所述的一种基于卷积神经网络和自注意力机制的智能矿物分选方法,其特征在于:所述步骤3中,基于卷积神经网络和自注意力机制的矿物图像分类模型包括卷积颈、下采样层、自注意力编码器、均值池化层、投影层和分类器。4.根据权利要求3所述的一种基于卷积神经网络和自注意力机制的智能矿物分选方法,其特征在于:所述卷积颈由3个卷积层构成,负责引入卷积运算的归纳偏执,其中一个卷积层的步长为2、卷积核大小为3
×
3,另外两个卷积层的步长为1、卷积核大小为3
×
3;所述下采样层由1个卷积层构成,负责降低特征图像维度并生成用于自注意力编码器特征运算的特征数据,其中卷积层的步长为2、卷积核大小为2
×
2;所述自注意力编码器由1个卷积层、2个层归一化层、1个卷积多头自注意力模块、1个倒置瓶颈前馈神经网络和3条残差连接构成,负责计算输入图像中各区域的注意力权重;所述均值池化层对输入特征值进行平均池化运算,负责汇聚重要的矿物图像特征信息;所述投影层由1个卷积层构成,负责整合前序网络所提取到的矿物图像特征信息,并将输出传输给分类器,其中卷积层的步长为1、卷积核大小为1
×
1;所述分类器由1个全连接层构成,负责建立特征信息与类别信息之间的关系。5.根据权利要求4所述的一种基于卷积神经网络和自注意力机制的智能矿物分选方法,其特征在于:所述自注意力编码器中的卷积多头自注意力模块包含1个深度卷积层、3个线性投影层和1个多头自注意力层;卷积多头自注意力模块负责计算输入图像中各区域的注意力权重;所述自注意力编码器...

【专利技术属性】
技术研发人员:邓方刘洋王雪旖陈杰
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1