当前位置: 首页 > 专利查询>武汉大学专利>正文

一种利用重复纹理约束的建筑物立面解析方法技术

技术编号:39853187 阅读:5 留言:0更新日期:2023-12-30 12:53
本发明专利技术公开了一种利用重复纹理约束的建筑物立面解析方法

【技术实现步骤摘要】
一种利用重复纹理约束的建筑物立面解析方法、系统及电子设备


[0001]本专利技术属于计算机视觉语义分割
,尤其涉及一种利用重复纹理约束的建筑物立面解析技术,主要用于建筑物立面分割

建筑物属性信息获取

建筑物附属物体检测等领域


技术介绍

[0002]建筑立面影像解析,作为城市场景理解的关键任务,专注于门

窗户

阳台等元素的精准分割

其派生应用涵盖建筑三维重建

自动驾驶

城市规划等领域,在计算机视觉领域具有突出的重要性

然而建筑物立面解析不是一项简单的语义分割任务,主要存在以下两点难点:

建筑物周围存在各种形状的树木

汽车等物体会对建筑物本体进行遮挡,这些遮挡信息是建筑物立面解析任务中很难解决的问题;

现存的建筑物立面数据集数据较少,深度学习方法在小数据集上很容易过拟合

[0003]传统的建筑物立面解析方法主要是基于建筑物的语法规则或者是基于计算机视觉的特征提取

由于建筑物的形状是人为设计的,具有很强的重复性,虽然从这些性质对规则的建筑物立面进行解析可以取得不错的效果,但是对于大范围

遮挡情况更复杂的场景无法实现高精度

自动化的解析效果

基于深度学习的方法是计算机视觉语义分割任务中常用的方法,可直接应用于建筑物立面解析

但是现有的方法很少针对建筑物本身的结构特点设计算法,通用的深度学习方法无法发挥建筑物立面具有重复纹理这一数据优点解决遮挡问题

并且在小样本的数据中,深度学习技术很难发挥优势


技术实现思路

[0004]本专利技术的技术目标在于解决在具有遮挡情况的建筑物立面数据上实现自动化且高精度解析的问题,提供一种利用重复纹理约束的建筑物立面解析方法

该方法的核心是设计一个利用局部和行列方向重复纹理特征约束的神经网络
Multi

DRCNet
,主要利用大范围空洞卷积核和矩形卷积核构建多层空洞卷积模块
MD

Module
和多尺度行列卷积模块
MRC

Module
,实现局部重复纹理与行列重复纹理特征提取,解决遮挡问题,提高门



阳台等具有重复性物体的解析精度

[0005]与现有方法相比,本专利技术在含有遮挡和无遮挡两种情况的建筑物立面解析都可以取得最好的效果

因此,本专利技术在建筑物立面解析相关的方向上具有很重要的实用价值和广泛的应用前景

[0006]本专利技术提供一种利用重复纹理约束的建筑物立面解析方法,该方法包括以下步骤:
[0007]步骤1,获取建筑物立面影像和对应的语义标签图,并进行数据预处理;
[0008]步骤2,构建利用局部和行列方向重复纹理特征约束的神经网络
Multi

DRCNet
,包括多层空洞卷积模块
MD

Module
和多尺度行列卷积模块
MRC

Module

[0009]所述
Multi

DRCNet
总体框架结构和
U

Net
一致,采用编码

解码结构,编码阶段使用一个预训练好的基础特征提取网络,解码阶段将
U

Net
上采样中的普通卷积层替换成多尺度行列卷积模块
MRC

Module
,在编码与解码中间加入
MD

Module

[0010]所述多层空洞卷积模块
MD

Module
包括多个空洞卷积,多尺度行列卷积模块
MRC

Module
包括多个不同方向的卷积;
[0011]步骤3,利用公开建筑物立面数据集训练
Multi

DRCNet
网络,并进行精度评价;
[0012]步骤4,加载在公开数据集训练好的权重,在步骤1准备的数据上微调训练好的神经网络,并利用微调好的网络解析建筑物立面

[0013]进一步的,步骤1的具体实现方法为:
[0014]步骤
1.1
,确定训练集:给定阈值
t
若影像总数小于或等于
t
,训练集数量为影像总数的一半;若影像总数大于
t
,训练集数量为
t/2
,然后将总数据顺序打乱,采用随机策略抽取保证数据的随机性;
[0015]步骤
1.2
,手动或自动标注数据集,获得建筑物立面影像需要分割的类别,得到建筑物立面影像对应的语义标签;
[0016]步骤
1.3
,对数据进行数据增强操作,包括随机旋转

缩放

平移

翻转,最后调整图像大小

[0017]进一步的,步骤2中多层空洞卷积模块
MD

Module
的输入和输出均为特定大小的特征图,
MD

Module
包括5个空洞卷积操作,卷积核是大小为3的正方形,但是它们的扩张率不同,分别是
1、2、4、8、16
,最后将
MD

Module
的输入和五个空洞卷积模块的输出连接,经过一次常规的卷积调整输出的维度之后输出到上采样过程,最后输出;
[0018]MD

Module
中的每一次卷积后都有批归一化
BN

ReLU
激活

[0019]进一步的,通过
Concatention
操作将
MD

Module
上采样的结果和编码阶段对称位置提取的特征拼接在一起构成当前
MRC

Module
的输入特征,将输入特征直接作为
MRC

Module
中,经过三个并行的子模块之后,特征被融合在一起通过一个卷积层输出,每个子模块有两个相同大小但是不同方向的卷积核
K
Row

K
Column
,分别用于获取行和列两个方向上的特征,再通过一个的卷积层融合行列方向上的信息

...

【技术保护点】

【技术特征摘要】
1.
一种利用重复纹理约束的建筑物立面解析方法,其特征在于,包括以下步骤:步骤1,获取建筑物立面影像和对应的语义标签图,并进行数据预处理;步骤2,构建利用局部和行列方向重复纹理特征约束的神经网络
Multi

DRCNet
,包括多层空洞卷积模块
MD

Module
和多尺度行列卷积模块
MRC

Module
;所述
Multi

DRCNet
总体框架结构和
U

Net
一致,采用编码

解码结构,编码阶段使用一个预训练好的基础特征提取网络,解码阶段将
U

Net
上采样中的普通卷积层替换成多尺度行列卷积模块
MRC

Module
,在编码与解码中间加入
MD

Module
;所述多层空洞卷积模块
MD

Module
包括多个空洞卷积,多尺度行列卷积模块
MRC

Module
包括多个不同方向的卷积;步骤3,利用公开建筑物立面数据集训练
Multi

DRCNet
网络,并进行精度评价;步骤4,加载在公开数据集训练好的权重,在步骤1准备的数据上微调训练好的神经网络,并利用微调好的网络解析建筑物立面
。2.
根据权利要求1所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:步骤1的具体实现方法为:步骤
1.1
,确定训练集:给定阈值
t
若影像总数小于或等于
t
,训练集数量为影像总数的一半;若影像总数大于
t
,训练集数量为
t/2
,然后将总数据顺序打乱,采用随机策略抽取保证数据的随机性;步骤
1.2
,手动或自动标注数据集,获得建筑物立面影像需要分割的类别,得到建筑物立面影像对应的语义标签;步骤
1.3
,对数据进行数据增强操作,包括随机旋转

缩放

平移

翻转,最后调整图像大小
。3.
根据权利要求1所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:步骤2中多层空洞卷积模块
MD

Module
的输入和输出均为特定大小的特征图,
MD

Module
包括5个空洞卷积操作,卷积核是大小为3的正方形,但是它们的扩张率不同,分别是
1、2、4、8、16
,最后将
MD

Module
的输入和五个空洞卷积模块的输出连接,经过一次常规的卷积调整输出的维度之后输出到上采样过程,最后输出;
MD

Module
中的每一次卷积后都有批归一化
BN

ReLU
激活
。4.
根据权利要求3所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:通过
Concatention
操作将
MD

Module
上采样的结果和编码阶段对称位置提取的特征拼接在一起构成当前
MRC

Module
的输入特征,将输入特征直接作为
MRC

Module
中,经过三个并行的子模块之后,特征被融合在一起通过一个卷积层输出,每个子模块有两个相同大小但是不同方向的卷积核
K
Row

K
Column
,分别用于获取行和列两个方向上的特征,再通过一个的卷积层融合行列方向上的信息
。5.
根据权利要求4所述的利用重复纹理约束的建筑物立面解析方法,其特征在于:卷积核
K
Row

K
Column
的大小分别是3行
15
列和
15<...

【专利技术属性】
技术研发人员:张永军岳冬冬刘欣怡
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1