一种基于深度神经网络的围龙屋建筑地理空间定位方法技术

技术编号:37229436 阅读:39 留言:0更新日期:2023-04-20 23:12
本发明专利技术公开了一种基于深度神经网络的围龙屋建筑地理空间定位方法,步骤如下:制作全类型围龙屋建筑遥感影像的训练集和验证集,包含3类形态微差的围龙屋影像,以及破损倒塌的围龙屋影像;使用上述训练集和验证集,在预训练权重模型YOLOv5x的基础上,训练得到优化的围龙屋识别模型;将带有地理空间信息的待识别影像集输入模型,得到识别结果;根据影像地理空间信息,将识别出的标签框中心点的归一化数值转化为真实投影坐标信息;进行数据集去重;通过地理信息处理软件加载中心点坐标,得到围龙屋识别结果及其可视化分布。本方法可用于大区域范围内各种类型、各种状态的围龙屋建筑的快速、准确检测,识别结果可作为围龙屋地面普查的潜在对象。查的潜在对象。查的潜在对象。

【技术实现步骤摘要】
一种基于深度神经网络的围龙屋建筑地理空间定位方法


[0001]本专利技术涉及基于遥感影像的建筑检测
,具体涉及一种基于深度神经网络的围龙屋建筑地理空间定位方法。

技术介绍

[0002]围龙屋是中国传统民居的特殊类型,是建筑文化遗产的典型代表。目前对围龙屋的调查主要依靠人工实地调查,围龙屋的线索来源主要是当地居民和村委报告。但是居民并非专业人员,对围龙屋认识不足,大量的围龙屋因漏报,没有被列入遗产保护名录。由于围龙屋广泛地分布在山区,导致专业人员调查缺少有效目标,需要花费极大的人力、财力和时间精力,难以通过田野调查获取完整的围龙屋分布目录。另外,围龙屋种类多样,不同地区的围龙屋形态也存在一定的差别,导致围龙屋确定的标准不够明晰。许多围龙屋还存在破损、倒塌等现象,这进一步增加了围龙屋的辨别难度。
[0003]目前的围龙屋检测做法的主要问题:
[0004](1)未提出围龙屋图像数据集的要求,特别是没有指出图像的裁切大小。当待识别的地理空间范围较大时,由于计算机性能的限制,其遥感影像需要通过裁切后,才能用于识别。
[0005](2)未提出围龙屋图像分辨率的要求。由于模型在微小对象识别方面可能存在一定的误差,因此围龙屋对象在单幅图像上的大小是重要的前提条件。检测时需要根据遥感影像的分辨率,对图像进行合理的裁切,以满足识别的需要。
[0006](3)围龙屋样本来源局限,且没有对围龙屋类型进行细分,因此训练样本中缺少不同类型的围龙屋图像,这将影响对不同特征的围龙屋的识别精度。
[0007](4)只局限于对围龙屋进行识别,没有提出返回围龙屋地理投影坐标的思路,因而无法用于辅助地面田野调查。

技术实现思路

[0008]本专利技术的目的是为了解决现有技术中的上述缺陷,提供一种基于深度神经网络的围龙屋建筑地理空间定位方法。该方法通过控制训练集和验证集中围龙屋的类型、保存状态等参数,基于YOLOv5x预训练权重模型训练得到优化的围龙屋识别模型,得到识别结果后,将归一化位置数值转化为真实的投影坐标信息,并利用地理信息处理软件进行可视化展示。该方法可用于大区域范围内各种类型、各种状态的围龙屋建筑的快速、准确检测,识别结果可作为围龙屋地面普查的潜在对象。
[0009]本专利技术的目的可以通过采取如下技术方案达到:
[0010]一种基于深度神经网络的围龙屋建筑地理空间定位方法,所述定位方法包括如下步骤:
[0011]S1、图源选择:以天地图公开的卫星遥感影像为基本图源,下载待识别区域遥感影像;
[0012]S2、图像裁切:对下载的图像进行裁剪,形成待识别影像集D;
[0013]S3、制作训练集和验证集:在待识别影像集D中,选择并标注包含围龙屋建筑的影像,形成训练集T和验证集Y,其中,所述训练集T和验证集Y中均包含两种目标类型,第1类标记为WLW,对应3种形态微差的围龙屋类型,即WLW_A,WLW_B,WLW_C;第2类标记为WLW_D,对应处于破损和倒塌状态的围龙屋;
[0014]S4、训练识别模型:使用上一个步骤制作的训练集T,在YOLOv5x预训练权重模型的基础上进行训练,在验证集Y上进行验证,获取围龙屋识别模型WLW_BEST.pt;
[0015]S5、围龙屋识别:将待识别影像集D中的图片,输入模型WLW_BEST.pt中进行识别,通过计算得到每一张影像中的围龙屋识别结果,记为r;
[0016]S6、计算识别结果标签框中心点的真实地理坐标值:提取识别结果对象所在源遥感影像左上角和右下角的投影坐标值,并提取识别结果标签框中心点的归一值,计算识别结果标签框中心点的投影坐标值,结果统一存储在识别结果数据集R中;
[0017]S7、数据点去重:对数据集R进行重复性检验,去除重复数据点并计算真实中心点数据;
[0018]S8、数据可视化:将识别结果数据集R中的围龙屋中心点投影坐标数据,根据中心点的x轴投影坐标值center_x和y轴投影坐标值center_y,导入地理信息处理软件中,进行点要素的可视化处理,得到围龙屋建筑的空间分布图。
[0019]进一步地,所述步骤S1中待识别区域遥感影像的影像分辨率d最低要求如下:
[0020]遥感影像的空间分辨率由小型围龙屋的尺寸所决定。围龙屋建筑后部由类似半圆形的建筑组成,这是围龙屋与其他建筑图像形态学差异的主要因素。由于围龙屋建筑规模差异比较大,其宽度多在20m

80m之间,因此小型围龙屋和大型围龙屋在影像图上所占据的像素区域差异比较大,故需要确保小型围龙屋建筑能够被准确识别。为了避免经过卷积后小型围龙屋后部半圆形建筑的特征像素过少而导致漏检,需保证小型围龙屋建筑在遥感影像上的像素区域至少为以下尺寸:
[0021]围龙屋宽度像素W_PXmin≥20px;
[0022]围龙屋进深像素L_PXmin≥20px;
[0023]而小型围龙屋的实际尺寸一般为:
[0024]围龙屋宽度W≥20m;
[0025]围龙屋进深L≥20m;
[0026]因此要求遥感影像的最小分辨率为:
[0027]d=(W/W_PXmin)或者d=(L/L_PXmin),即d≥1m/px。根据天地图遥感影像瓦片层级对应的分辨率,应选择≥18级影像数据,影像格式应为带地理空间信息的geotiff。
[0028]进一步地,所述步骤S2中影像裁切的大小为640px*640px。该大小能使其与YOLOv5预训练模型的图片尺寸保持一致,能够避免图像送入神经网络时进行缩放,而导致围龙屋在图像上的特征改变。
[0029]进一步地,由于目前没有公开的围龙屋数据集供本专利技术使用,因此本专利技术中收集并制作了相关的围龙屋训练集T和验证集Y。所述步骤S3中训练集T中包含两种目标类型,第1类标记为WLW,如图2所示,对应3种形态微差的围龙屋类型,其中WLW_A对应后部形状为半圆形的围龙屋,WLW_B对应后部形状为半圆角矩形的围龙屋,WLW_C对应外部被其他建筑构
造包围的围龙屋,每种类别的样本图片数量≥250张,并且围龙屋总样本数量≥900个。该形态微差分类一方面考虑了围龙屋的主体共性特征,将其作为同一类对象进行识别;另一方面,将具有一定微差的不同类型的围龙屋均纳入到训练样本中,能够提升识别的正确率。第2类标记为WLW_D,对应破损或倒塌状态的围龙屋,样本图片数量≥250张,并且围龙屋总样本数量≥300个。由于围龙屋为古建筑,许多围龙屋处于破损和倒塌的状态,这类围龙屋在遥感影像上的图像形态学特征与保存较好的围龙屋存在较大的区别,将破损围龙屋作为一种单独的类型进行识别能防止识别结果大量漏检,提升识别准确度。验证集Y的标记方式与训练集T保持一致,其中,WLW_A、WLW_B、WLW_C、WLW_D每种类别的验证集样本图片数量≥50张,并且围龙屋总样本数量≥250个。
[0030]进一步地,所述步骤S3中围龙屋影像标注方式包括3种:方式一,如图3所示,WLW_A和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的围龙屋建筑地理空间定位方法,其特征在于,所述定位方法包括如下步骤:S1、图源选择:以天地图公开的卫星遥感影像为基本图源,下载待识别区域遥感影像;S2、图像裁切:对下载的图像进行裁剪,形成待识别影像集D;S3、制作训练集和验证集:在待识别影像集D中,选择并标注包含围龙屋建筑的影像,形成训练集T和验证集Y,其中,所述训练集T和验证集Y中均包含两种目标类型,第1类标记为WLW,对应3种形态微差的围龙屋类型,即WLW_A,WLW_B,WLW_C;第2类标记为WLW_D,对应处于破损和倒塌状态的围龙屋;S4、训练识别模型:使用上一个步骤制作的训练集T,在YOLOv5x预训练权重模型的基础上进行训练,在验证集Y上进行验证,获取围龙屋识别模型WLW_BEST.pt;S5、围龙屋识别:将待识别影像集D中的图片,输入围龙屋识别模型WLW_BEST.pt中进行识别,通过计算得到每一张影像中的围龙屋识别结果,记为r;S6、计算识别结果标签框中心点的真实地理坐标值:提取识别结果对象所在源遥感影像左上角和右下角的投影坐标值,并提取识别结果标签框中心点的归一值,计算识别结果标签框中心点的投影坐标值,结果统一存储在识别结果数据集R中;S7、数据点去重:对数据集R进行重复性检验,去除重复数据点并计算真实中心点数据;S8、数据可视化:将识别结果数据集R中的围龙屋中心点投影坐标数据,根据中心点的x轴投影坐标值center_x和y轴投影坐标值center_y,导入地理信息处理软件中,进行点要素的可视化处理,得到围龙屋建筑的空间分布图。2.根据权利要求1所述的一种基于深度神经网络的围龙屋建筑地理空间定位方法,其特征在于,所述步骤S1中待识别区域遥感影像的影像分辨率d最低要求为1m/px,影像格式应为带地理空间信息的geotiff,其中,px代表像素;根据天地图遥感影像瓦片层级对应的分辨率,应选择大于等于18级的影像数据。3.根据权利要求1所述的一种基于深度神经网络的围龙屋建筑地理空间定位方法,其特征在于,所述步骤S2中影像裁切的大小为640px*640px,其中,px代表像素。4.根据权利要求1所述的一种基于深度神经网络的围龙屋建筑地理空间定位方法,其特征在于,所述步骤S3中,训练集T和验证集Y均包含两种目标类型,第一种目标类型记为WLW,含3种形态微差的围龙屋,其中WLW_A对应后部形状为半圆形的围龙屋,WLW_B对应后部形状为半圆角矩形的围龙屋,WLW_C对应外部被其他建筑构造包围的围龙屋;另一种目标类型是破损或倒塌状态的围龙屋,记为WLW_D,其中,WLW_A、WLW_B、WLW_C、WLW_D每种类别的训练集样本图片数量≥250张,并且围龙屋总样本数量≥1200个;每种类别的验证集样本图片数量≥50张,并且围龙屋总样本数量≥250个。5.根据权利要求1所述的一种基于深度神经网络的围龙屋建筑地理空间定位方法,其特征在于,所述步骤S3中围龙屋影像标注方式包括3种:方式一,WLW_A和WLW_B要求将完整的围龙屋范围纳入标注框内部;方式二,WLW_C要求包含建筑内部围龙屋后部的半圆型构造,以及与之相连的前部建筑物,但是不包含半圆型构造外部的其他建筑组成部分;方式三,WLW_D要求将围龙屋倒塌的部分完全包含到标注框内部,即将该围龙屋未倒塌时的整体范围纳入标注框内部。6.根据权利要求1所述的一种基于深度神经网络的围龙屋建筑地理空间定位方法,其
特征在于,所述步骤S4中训练并获取模型WLW_BEST.pt的过程包括:设置YOLOv5网络数据配置文件初始参数并输入网络结构,使用yolov5x.pt的预训练权重,训练迭代轮数为300世代,模型初始学习率为0.01;将训练得到的模型在验证集Y上进行测试,验证模型的有效性,最终得到围龙屋识别模型WLW_BEST.pt。7.根据权利要求1所述的一种基于深度神经网络的围龙屋建筑地理空间定位方法,其特征在于,所述步骤S5中,对于待识别影像集D中的图片输入至模型WLW_BEST.pt进行计算,设置置信度阈值和交并比阈值,保存分类结果和置信度得分,得到每一幅遥感影像的识别结果r,识别结果写入一个txt文档中,其中,识别结果r包含一条或多条识别结果;设第i幅遥感影像对应n个识别结果,k为n中的一条结果,1≤k≤n,则每一条识别结果r
ik
中都包含以下内容:图片名称:与源图片保持一致,记为pic_name
ik
;识别结果标签框中心点x轴坐标归一值:记为x
ik
_center;识别结果标签框中心点y轴坐标归一值:记为y
ik
_center;识别结果标签框宽度的归一值:记为w
ik
;识别结果标签框高度的归一值:记为h
ik
;置信度:记为conf
ik
;类别:0,对应于WLW_A,WLW_B,WLW_C;1,对应于WLW_D。8.根据权利要求1所述的一种基于深度神经网络的围龙屋建筑地理空间定位方法,其特征在于,所述步骤S6中,提取识别对象所在第i幅遥感影像的...

【专利技术属性】
技术研发人员:陶金冯惠城叶昭怡李庚陈梓炫李敏浩
申请(专利权)人:广州大斧文化科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1