【技术实现步骤摘要】
一种利用重复纹理约束的建筑物立面解析方法、系统及电子设备
[0001]本专利技术属于计算机视觉语义分割
,尤其涉及一种利用重复纹理约束的建筑物立面解析技术,主要用于建筑物立面分割
、
建筑物属性信息获取
、
建筑物附属物体检测等领域
。
技术介绍
[0002]建筑立面影像解析,作为城市场景理解的关键任务,专注于门
、
窗户
、
阳台等元素的精准分割
。
其派生应用涵盖建筑三维重建
、
自动驾驶
、
城市规划等领域,在计算机视觉领域具有突出的重要性
。
然而建筑物立面解析不是一项简单的语义分割任务,主要存在以下两点难点:
①
建筑物周围存在各种形状的树木
、
汽车等物体会对建筑物本体进行遮挡,这些遮挡信息是建筑物立面解析任务中很难解决的问题;
②
现存的建筑物立面数据集数据较少,深度学习方法在小数据集上很容易过拟合
。
[0003]传统的建筑物立面解析方法主要是基于建筑物的语法规则或者是基于计算机视觉的特征提取
。
由于建筑物的形状是人为设计的,具有很强的重复性,虽然从这些性质对规则的建筑物立面进行解析可以取得不错的效果,但是对于大范围
、
遮挡情况更复杂的场景无法实现高精度
、
自动化的解析效果
。
基于深度学习的方法是计算机视觉语义分割任务中常用的方
【技术保护点】
【技术特征摘要】
1.
一种利用重复纹理约束的建筑物立面解析方法,其特征在于,包括以下步骤:步骤1,获取建筑物立面影像和对应的语义标签图,并进行数据预处理;步骤2,构建利用局部和行列方向重复纹理特征约束的神经网络
Multi
‑
DRCNet
,包括多层空洞卷积模块
MD
‑
Module
和多尺度行列卷积模块
MRC
‑
Module
;所述
Multi
‑
DRCNet
总体框架结构和
U
‑
Net
一致,采用编码
‑
解码结构,编码阶段使用一个预训练好的基础特征提取网络,解码阶段将
U
‑
Net
上采样中的普通卷积层替换成多尺度行列卷积模块
MRC
‑
Module
,在编码与解码中间加入
MD
‑
Module
;所述多层空洞卷积模块
MD
‑
Module
包括多个空洞卷积,多尺度行列卷积模块
MRC
‑
Module
包括多个不同方向的卷积;步骤3,利用公开建筑物立面数据集训练
Multi
‑
DRCNet
网络,并进行精度评价;步骤4,加载在公开数据集训练好的权重,在步骤1准备的数据上微调训练好的神经网络,并利用微调好的网络解析建筑物立面
。2.
根据权利要求1所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:步骤1的具体实现方法为:步骤
1.1
,确定训练集:给定阈值
t
若影像总数小于或等于
t
,训练集数量为影像总数的一半;若影像总数大于
t
,训练集数量为
t/2
,然后将总数据顺序打乱,采用随机策略抽取保证数据的随机性;步骤
1.2
,手动或自动标注数据集,获得建筑物立面影像需要分割的类别,得到建筑物立面影像对应的语义标签;步骤
1.3
,对数据进行数据增强操作,包括随机旋转
、
缩放
、
平移
、
翻转,最后调整图像大小
。3.
根据权利要求1所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:步骤2中多层空洞卷积模块
MD
‑
Module
的输入和输出均为特定大小的特征图,
MD
‑
Module
包括5个空洞卷积操作,卷积核是大小为3的正方形,但是它们的扩张率不同,分别是
1、2、4、8、16
,最后将
MD
‑
Module
的输入和五个空洞卷积模块的输出连接,经过一次常规的卷积调整输出的维度之后输出到上采样过程,最后输出;
MD
‑
Module
中的每一次卷积后都有批归一化
BN
和
ReLU
激活
。4.
根据权利要求3所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:通过
Concatention
操作将
MD
‑
Module
上采样的结果和编码阶段对称位置提取的特征拼接在一起构成当前
MRC
‑
Module
的输入特征,将输入特征直接作为
MRC
‑
Module
中,经过三个并行的子模块之后,特征被融合在一起通过一个卷积层输出,每个子模块有两个相同大小但是不同方向的卷积核
K
Row
和
K
Column
,分别用于获取行和列两个方向上的特征,再通过一个的卷积层融合行列方向上的信息
。5.
根据权利要求4所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:卷积核
K
Row
和
K
Column
的大小分别是3行
15
列和
15<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。