【技术实现步骤摘要】
一种基于特征融合的图像分割方法及装置
[0001]本专利技术属于图像处理
,具体涉及一种基于特征融合的图像分割方法及装置。
技术介绍
[0002]随着人工智能技术和图像处理技术的飞速发展,图像分割在医学影像和盲人导航等领域得到了越来越多的应用。盲人导航一般由安装在眼镜或头盔上的导航装置实现。所述导航装置一般由摄像头、数据处理单元和语音模块等组成。摄像头用于实时拍摄前方的视频图像;数据处理单元通过对所述视频图像进行特征提取、图像分割、目标识别等处理感知前方环境,确定是否存在水坑、楼梯等障碍物,并估算障碍物的位置、大小等;语音模块用于与导航装置佩戴者进行信息交互,如接收佩戴者的指令,向佩戴者播放识别结果(前方环境中的障碍物信息)等。
[0003]图像分割是盲人导航数据处理中非常关键的一个环节,一些应用场景的图像分割难度很大,比如楼梯图像的分割。楼梯是一种普遍存在且结构复杂的建筑,它们一级与一级进行紧密连接,同时由于不同台阶之间的相似度高,使得不同台阶之间的区分非常困难。如果只基于普通相机输入的RGB图像进行台阶分割 ...
【技术保护点】
【技术特征摘要】
1.一种基于特征融合的图像分割方法,其特征在于,包括以下步骤:实时获取由深度相机输入的RGB图像和深度图像;分别对RGB图像和深度图像进行特征提取;对提取的RGB图像特征和深度图像特征进行融合,并基于融合特征进行图像分割。2.根据权利要求1所述的基于特征融合的图像分割方法,其特征在于,所述特征提取为多尺度特征提取。3.根据权利要求2所述的基于特征融合的图像分割方法,其特征在于,所述对提取的RGB图像特征和深度图像特征进行融合的方法包括:分层融合:对每层相同尺度的RGB图像特征和深度图像特征进行融合,得到多个不同尺度的融合特征;多层融合:对所述多层不同尺度的融合特征进行融合。4.根据权利要求3所述的基于特征融合的图像分割方法,其特征在于,所述分层融合具体包括:将深度图像特征作为三个通道的输入,得到三通道深度图像特征;将RGB图像特征和三通道深度图像特征分别经过一个3*3卷积运算后,在通道方向进行叠加;进行逐通道加权,各通道的权重由激活函数SoftMax获得。5.根据权利要求3所述的基于特征融合的图像分割方法,其特征在于,所述多层融合具体包括:通过上采样将多层不同尺度的融合特征归一化为相同同尺度的融合特征;对多层相同同尺度的融合...
【专利技术属性】
技术研发人员:何福金,吴子丰,俞益洲,李一鸣,乔昕,
申请(专利权)人:杭州深睿博联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。