当前位置: 首页 > 专利查询>苏州大学专利>正文

面向自动驾驶环境的语义分割自动化方法技术

技术编号:39486585 阅读:12 留言:0更新日期:2023-11-24 11:06
本发明专利技术公开了一种面向自动驾驶环境的语义分割自动化方法

【技术实现步骤摘要】
面向自动驾驶环境的语义分割自动化方法、系统及介质


[0001]本专利技术涉及图像语义分割
,具体涉及面向自动驾驶环境的语义分割自动化方法

系统及介质


技术介绍

[0002]目前自动驾驶避障主要依靠各种图像识别算法,而语义分割正是最重要的一种环境理解手段

它能够实现像素级别的图像分类,对于自动驾驶系统精确把握周围环境信息尤其重要

但是语义分割的训练繁琐且需要大量的人力投入,不适宜模型的快速迁移部署,因此亟需一种能够自动化训练语义分割模型的方法

[0003]近年来,自动化机器学习
(AutoML)
兴起
。AutoML
泛指在机器学习各阶段流程中有一个或多个阶段采取自动化而无需人工参与的实现方案
。AutoML
的目的是使人从这些机器学习应用程序中解放出来,摆脱上述繁琐的模型设计与优化等过程,实现真正意义上的机器学习
。AutoML
的完整流程由数据准备

特征工程

模型选择

参数优化与模型评估这些过程组成

对于上述五个过程,已经涌现出了不少的算法,甚至是全流程自动化的系统,它们在语音

视频

搜索等领域应用广泛,但是在自动驾驶领域,缺少特异化自动化机器学习方法

[0004]语义分割自动化学习已取得不少成果

文件1指出手动设计调整语义分割网络参数需要大量专家工作,同时很难在速度与性能之间找到平衡点,难以达到某些实时应用如自动驾驶的要求

因此他提出了一种可定制的架构搜索方法来自动生成具有特定约束的轻量级网络

这是首次在语义分割自动生成网络架构方向的尝试

文件2指出由于手动设计网络乏味且难以处理,因此对于特定任务的神经网络结构自动化设计是一条非常有前途的途径

他针对语义分割设计使用
RNN
控制器循环输出网络结构和各层
operations
,并对紧凑语义分割进行专门修改并加入辅助单元以加速搜索和训练

文件3提出一个包含许多流行设计的网络级搜索空间,并开发了一个允许基于梯度的架构搜索的公式

文件4将
NASNet(
一种
AutoML
强化学习算法
)
应用于
Deep U

Net
网络以提高图像语义分割性能

文件5提出了一种解耦的

细粒度的延迟正则化方法,解决了使用
NAS
自动设计语义分割模型崩溃的问题,更好的实现高精度与低延迟之间的平衡

文件6等人将自动化语义分割引入医学领域,提出了一种用于密集标记的复合结构,其中定制的三维全卷积网络探索初始标记的空间强度并发性,而多向递归神经网络
(RNN)
编码空间顺序性,以对抗边界模糊性,从而显著细化,可以同时分割多个具有强烈临床意义的解剖结构,包括胎儿

妊娠囊和胎盘

由此可见,语义分割自动化学习正在成为一个非常重要和具有现实意义的研究方向

[0005]当前语义分割方法存在以下缺点:
[0006](1)
在实际应用中,探索未知场景是无法避免的,这也对选取数据的典型性和通用性提出了更高的要求

人工训练语义分割网络需要大量已标注的数据,而数据的采集与标注是一件繁琐的任务

为了提升数据集的质量,不得不认真研究数据的分布,剔除遮挡重叠等不符数据

每一步都需要相当多的人力投入,同时过少的数据容易使网络进入过拟合状
态,因此对数据量也提出了要求

[0007](2)
在每个阶段训练完成后,需要研究人员评价语义分割学习效果,之后手动调整合适的参数进行二次训练,缺乏自我更新机制,同时调参的过程更是极度依赖研究者的经验判断,具有很强的主观性

[0008][1]Zhang,Y.,Qiu,Z.,Liu,J.,Yao,T.,Liu,D.,&Mei,T.(2019).Customizable architecture search for semantic segmentation.In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(pp.11641

11650).
[0009][2]Nekrasov,V.,Chen,H.,Shen,C.,&Reid,I.(2019).Fast neural architecture search of compact semantic segmentation models via auxiliary cells.In Proceedings of the IEEE Conference on Computer Vision and PatternRecognition(pp.9126

9135).
[0010][3]Liu,C.,Chen,L.C.,Schroff,F.,Adam,H.,Hua,W.,Yuille,A.L.,&Fei

Fei,L.
[0011](2019).Auto

deeplab:Hierarchical neural architecture search for semantic imagesegmentation.In Proceedings of the IEEE Conference on Computer Vision andPattern Recognition(pp.82

92)
[0012][4]Kim,Hyoung Seok,Kee

YounYoo,and Lae Hyun Kim."Improved Performanceof Image Semantic Segmentation using NASNet."Korean ChemicalEngineering Research 57.2(2019):274

282.
[0013][5]Chen,Wuyang,et al."Fasterseg:Searching for faster real

time semanticsegmentation."arXiv preprint arXiv:1912.10917(2019).
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种面向自动驾驶环境的语义分割自动化方法,其特征在于,包括以下步骤:步骤
S1
:获取车前可见光图像数据,对所述车前可见光图像数据进行数据清洗,得到车前可见光图像数据集,将所述车前可见光图像数据集划分为训练数据集和测试数据集;所述车前可见光图像数据包括:不同照明和天气条件下直线

弯道和岔道的轨道图像;步骤
S2
:将所述训练数据集输入到语义分割模型中进行训练,得到分割图像,对所述分割图像进行评分,得到数据评分;步骤
S3
:将所述分割图像的数据评分作为轨道状态输入到强化学习模型中进行训练,得到筛选后的分割图像;步骤
S4
:汇总所述筛选后的分割图像,检索到其原始数据,输入到所述语义分割模型进行二次训练,得到权重参数,将所述权重参数加载到所述语义分割模型中,针对待检测的图像,运行所述语义分割模型得到检测结果
。2.
如权利要求1所述的面向自动驾驶环境的语义分割自动化方法,其特征在于:步骤
S3
中,将所述分割图像的数据评分作为轨道状态输入到强化学习模型中进行训练的具体步骤为:步骤
S31
:定义动作空间
A
=<
a1,a2,...,a
N
>,
S
为状态空间,包含
N
维数据,其中1~
N
‑1维表示之前处理后的数据,第
N
维表示正在处理的候选数据,状态
s
t
∈S
表示智能体在
t
时刻的状态,初始化状态
s0、
经验回放池
D、
目标
Q
网络以及当前
Q
网络;步骤
S32
:智能体根据当前状态
s
t
,利用
ε

Greedy
方法选择动作
a
t
执行,以1‑
ε
的概率根据当前
Q
网络输出的最大
Q
值选择动作同时以
ε
的概率从其他动作中随机选择一个动作
a
t
作为当前的动作,执行动作
a
t
后,获得奖励
r
t
,同时智能体转移到新状态
s
t+1
;步骤
S33
:智能体将交互经验
e
t

(s
t
,a
t
,r
t
,s
t+1
)
存放到经验回放池
D
t

{e1,...,e
t
}
中,同时从
D
t
中随机选择一批经验
{e1,...,e
j
}
,计算目标值
y
j
和损失函数
L(
θ
)
,并采用梯度下降法更新当前
Q
网络的参数
θ
;步骤
S34
:循环运行步骤
S32

S33
直到达到设置的最大迭代次数或者网络收敛为止;其中,所述强化学习模型为
DQN
模型,
DQN
模型包括智能体与外界环境,智能体与外界环境的交互使用马尔科夫决策过程进行建模
。3.
如权利要求2所述的面向自动驾驶环境的语义分割自动化方法,其特征在于:步骤...

【专利技术属性】
技术研发人员:吴澄叶陆琴盛洁王阳
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1