【技术实现步骤摘要】
多视觉任务协同的深度估计模型的构建方法
本专利技术涉及电子行走辅助设备
,具体是一种电子行走辅助设备中的多视觉任务协同的深度估计模型的构建方法。
技术介绍
据世界卫生组织最新统计数据显示,世界范围内视力受损人数约为2.85亿,仅中国低视力人士和盲人达到了两千万,日常出行是视力障碍者日常生活中面临的最大问题。在科技和网络快速发展的今天,它们比常人更渴望能享受到人工智能带来的便利。因此,如何造福视力受损人群,延展他们的视觉来感知周围环境是一个重要的研究课题。传统导盲辅助技术及工具有较大的局限性,随着智能技术的飞速发展,开发具有行走辅助系统的电子移动设备(ETA,ElectronicTravelAids)成为一种有效的方法。ETA这类基于感知替代的辅助设备通过不同传感器获取外部环境数据,获得使用者周围环境的三维信息,但是外部环境错综复杂,要保证使用者行走安全,必须快速准确反应周围环境状况。视觉信息作为外部环境的感知来源具有其他信息无法比拟的优势,而视觉问题主要由识别、重建和重组三大部分构成,其中场景深度估计是重建的关 ...
【技术保护点】
1.一种多视觉任务协同的深度估计模型的构建方法,其特征在于,包括以下具体步骤:/n立体视觉约束下的快速场景深度估计模型构建:/n采用构建多尺度多重预测的高速推理模型的方法,通过快速特征提取网络提取多分辨率的深度特征,经过多阶段视差细化方案进行视差精度提升;/n视差几何和知识先验协同的模型优化:利用一种知识置信引导的无监督学习框架,在无需真实深度值参与的情况下,通过对模型深度预测值进行权衡,达到模型微调,增加模型泛化能力的目的;/n联合语义特征的目标深度精细化:构造一个从粗糙到精细的逐阶段优化的类似深度估计的模块语义分割模块,形成特征层共享的对称结构,再利用相同阶段不同网络特 ...
【技术特征摘要】
1.一种多视觉任务协同的深度估计模型的构建方法,其特征在于,包括以下具体步骤:
立体视觉约束下的快速场景深度估计模型构建:
采用构建多尺度多重预测的高速推理模型的方法,通过快速特征提取网络提取多分辨率的深度特征,经过多阶段视差细化方案进行视差精度提升;
视差几何和知识先验协同的模型优化:利用一种知识置信引导的无监督学习框架,在无需真实深度值参与的情况下,通过对模型深度预测值进行权衡,达到模型微调,增加模型泛化能力的目的;
联合语义特征的目标深度精细化:构造一个从粗糙到精细的逐阶段优化的类似深度估计的模块语义分割模块,形成特征层共享的对称结构,再利用相同阶段不同网络特征,经过视差获取网络得到融入了语义几何信息的视差图;进一步达到障碍物目标精细化的目的。
2.根据权利要求1所述的一种多视觉任务协同的深度估计模型的构建方法,其特征在于,所述立体视觉约束下的快速场景深度估计模型构建具体为:
1)快速特征提取模块:获得不同尺度上的特征提取和表达,采用轻量化的网络架构提取左、右图像对多分辨率下的特征,并提取不同分辨率下的图片特征,分别被应用于不同尺度的阶段,原始图片通过池化或者卷积进行下采样操作,低分辨率的特征图可以包含全局上下文信息,高分辨率的特征图包含更多的细节信息,在不同尺度下的最终的卷积层都集合了前面已经计算过的不同尺度的特征;
2)视差估计模块:假设特征图维度为H×W,M表示场景最大候选视差,每次像素位置在每个视差上构成一个H×W×M成本立方体,因为不适定区域的匹配都会给成本立方体带来较大误差,因此加入三维的网络结构进一步提升成本立方体的精度,假设Cijk表示表示左图像素点P(i,j)在第k个视差时的成本代价,那么成本与像素颜色空间值满足:最后通过最小化Cijk得到低分辨深度图d3;
3)差异预测模块:在高分辨率场景下,两图之间的视差可能会非常大,采用计算差异可有效的提升运算速度,假设已获得初始深度图像d3,在尺度1和尺度2阶段只预测差异,首先对d3进行上采样到更高分辨率的d32,若左视差图(i,j)预测值为k,则将左图每个像素(i,j)的值覆盖对应的右图像素(i,j+k)的值,若超出边界则使用0,如果目前视差预测是正确的,那么更新的右图特征图会与左...
【专利技术属性】
技术研发人员:李婕,周顺,巩朋成,石文轩,张正文,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。