【技术实现步骤摘要】
本专利技术属于地质灾害隐患识别,涉及一种黄土塬边落水洞智能识别的方法。
技术介绍
1、落水洞是黄土高原地区一种独特的黄土潜蚀类地质灾害,由于砂质土含量高,有机质含量低,结构松散,垂直裂缝发育,优先流道普遍存在,自重湿塌性强,抗侵蚀能力差,崩解能力强。因此,在黄土环境中,落水洞非常发达。黄土塬边及高阶地前缘因具有充足的汇水面积和良好的出口条件,这些洞穴通常广泛发育于塬台边坡附近,不但是塬水下沟的重要通道,更是沟头前进和沟岸扩张等过程的早期发育形式,加剧了黄土塬区的水土流失问题。研究表明,当落水洞现象达到一定规模时,会显著影响斜坡的稳定性,进而引发多级链生灾害,对道路、天然气、水管道、厂房和民居等造成威胁。因此,开展黄土落水洞的精确识别工作,对提升黄土地区防灾减灾能力至关重要。
2、随着测量技术和设备的不断进步,人类已建立起从太空到低空、近地、地下等全方位的探测系统,并可用于落水洞的探测与监测。其中,高分辨率遥感卫星图像和无人机系统(uas)图像可用于解释、编目和绘制陷坑;合成孔径雷达干涉测量(insar)技术可用于监测岩溶塌陷或地面沉降的加深速度;机载激光雷达测量可用于喀斯特地貌中大型陷坑的深度探测和地形制图;探地雷达(gpr)和电阻率层析成像(ert)技术可用于反演岩溶陷坑的二维或三维地下水水文地质结构,而挖沟法有助于了解陷落孔的地层剖面和物质结构。然而,当前大多数陷坑探测是在岩溶环境中进行的,而黄土中发育的陷坑洞穴还较少。
3、近年来,越来越多的学者结合高分辨率地形数据和机器学习方法,致力于检测和识别陷
4、尽管已有研究在小尺度陷坑数据集的构建方面取得了进展,现有的方法大多依赖人工模拟或近距离拍摄的影像,面临着数据采集效率低下的问题。黄土落水洞广泛分布在野外,依赖人工近距离识别不仅耗时耗力,而且受到复杂地质环境的影响,易出现失准现象。此外,由于黄土落水洞的特殊地质背景,其尺寸、形态以及分布特征与其他类型的陷坑差异较大,导致现有方法难以在大范围内应用。针对这些问题,近年来也有研究尝试通过无人机系统(uas)和手持激光扫描仪(hls)对黄土落水洞进行调查,采用点云学习技术(如pointnet++网络)取得了较好的识别效果。然而,这些方法在数据采集上仍受到设备成本、实地调查和人员安全等因素的制约。机载激光雷达由于能耗过高,难以在较大范围内快速获取高分辨率数据,因此在黄土塬边区域的应用受到限制。此外,由于黄土质地的特殊性,黄土落水洞与其他地质环境下的塌陷洞穴在尺寸、形态和分布上的差异,使得黄土落水洞的识别更加复杂,现有方法在此领域的应用效果不佳。
技术实现思路
1、本专利技术的目的是提供一种基于残差注意门的黄土塬边落水洞智能识别方法及系统,旨在通过高分辨率遥感影像直接提取像素级的黄土落水洞,解决了现有技术方法中高人力、物力以及时间成本的问题。
2、本专利技术所采用的技术方案是:
3、一种黄土塬边落水洞智能识别的方法,包括以下步骤:
4、s1、基于无人机遥感影像的训练数据获取;
5、s1.1、获取研究区域的无人机遥感影像;
6、获取研究区域的无人机遥感影像,通过规划航线、行高等无人机参数进行实地获取。
7、s1.2、无人机影像预处理;
8、对获取到的无人机影像进行预处理操作,包括去除畸变与几何校正、正射校正、影像融合与拼接、辐射校正、噪声去除与影像增强、几何精度检查、影像配准,以把控无人影像的质量。
9、s1.3、黄土塬边落水洞标签制作;
10、根据预处理后的无人机影像进行样本制作,用于网络训练时的权重参数学习。制作标签时,先依据黄土塬边落水洞的边界进行矢量化,而后将其栅格化输出。
11、s1.4、影像及标签尺寸裁剪;
12、对制作好的标签及影像裁剪至512大小的尺寸,用于满足网络固定的数据输入尺寸。
13、s1.5、数据结构划分;
14、采用随机划分的方式将裁剪后的影像及对应标签按7:3划分为训练集和验证集,以构成最终使用于网络权重训练的黄土塬边落水洞数据集。
15、s2、基于深度多级残差门控注意力的级联网络框架;
16、步骤2.1、通过transformer与卷积运算重构后的编码器将影像中的黄土塬边落水洞逐步地抽象为高维语义信息;
17、通过transformer编码块和卷积编码块对落水洞影像进行特征学习。transformer编码块采用swin transformer的swin-t配置,将其首层中的图像块分区、线性嵌入以及滑动窗口注意力运算模块进行整合。通过这种方式将影像进行位置编码,以更好地适应黄土落水洞大范围分布于黄土塬边的特点。transformer结构中的多头注意力机制是该网络结构中关键的组成部分,它可以帮助网络更好地学习并理解输入序列中的信息,从而提高模型的表达能力和泛化能力,其运算过程如下:
18、
19、zi=attention(qi,ki,vi),i=1...h (2)
20、multihead(q,k,v)=concat(z1,z2,...,zh)w0 (3)
21、式中,i表示头编号(范围为1到h),表示输出的投影矩阵,zi表示每个注意力头的输出矩阵,q、k和v分别表示输入序列投影到查询(query,q)、键(key,k)和数值(value,v)这三种属性空间向量,是三个不同的线性矩阵。
22、transformer位置编码是为了在网络中引入序列的位置信息,以帮助模型更好地理解和处理输入序列的顺序关系。该编码通常采用的方法是使用固定的位置编码矩阵,该矩阵的维度与输入序列的维度相同,因此可以直接将位置编码与输入向量相加。具体公式如下:
23、
24、式中,(pos,2i)表示以偶数维度将输入序列引入至其pos位置,dmodel为模型引入的维度总数量。通过引入位置编码,transformer网络可以更好地捕捉图中的位置特征信息,有助于改进网络对于序列的建模能力。
25、卷积编码块则采用resnet残差结构中的resnet50配置,本文档来自技高网...
【技术保护点】
1.一种黄土塬边落水洞智能识别的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种黄土塬边落水洞智能识别的方法,其特征在于,步骤S2.1具体方法为:
3.根据权利要求2所述的一种黄土塬边落水洞智能识别的方法,其特征在于,步骤S2.2具体方法为:
4.根据权利要求3所述的一种黄土塬边落水洞智能识别的方法,其特征在于,步骤S2.3具体方法为:
【技术特征摘要】
1.一种黄土塬边落水洞智能识别的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种黄土塬边落水洞智能识别的方法,其特征在于,步骤s2.1具体方法为:
3.根据...
【专利技术属性】
技术研发人员:朱武,庞兆峻,王越,张锐煊,范宝迪,李振洪,
申请(专利权)人:长安大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。