【技术实现步骤摘要】
训练数据的生成方法及装置、计算机可读介质和电子设备
[0001]本公开涉及图像处理
,具体涉及一种训练数据的生成方法、训练数据的生成装置、计算机可读介质和电子设备。
技术介绍
[0002]深度图广泛应用于计算机视觉任务,比如视觉里程计、视觉建图、视觉SLAM、三维重建、场景感知、光斑渲染、自由视点渲染等等。在相关技术中,深度图中深度真值的获取方法一般有以下三种:第一种是通过深度传感器捕获真值数据,包括Time
‑
of
‑
flight(ToF)、结构光和双目立体匹配;第二种是在彩色图像上手工标注两点之间的远近关系;第三种则是基于自监督学习等机器学习或深度学习的方法,通过帧间位姿预测网络的协助获取位姿一致的深度图。
[0003]在上述方法中,第一种方法需要专业的采集设备,且每次采集只能获得单一的场景种类。同时,用于采集的传统深度传感器(比如Tof、结构光和双目立体匹配)设备成本较高且功耗较大;第二种方法则依赖大量人工操作,而且只能获得稀疏点对的远近关系;第三种方法则需要大量训练数 ...
【技术保护点】
【技术特征摘要】
1.一种训练数据的生成方法,其特征在于,包括:获取视频集合;所述视频集合中包括至少一个2D视频;基于预设跟踪条件对各所述2D视频进行帧筛选,得到各所述2D视频对应的跟踪帧序列;基于各所述跟踪帧序列进行三维重建,得到重建图像和所述重建图像对应的深度数据,并将所述重建图像和所述重建图像对应的深度数据作为第一训练数据。2.根据权利要求1所述的方法,其特征在于,所述基于预设跟踪条件对各所述2D视频进行帧筛选,得到各所述2D视频对应的跟踪帧序列,包括:针对每一个所述2D视频分别进行帧筛选处理,所述帧筛选处理包括:基于预设步长在所述2D视频中抽取第i个视频帧;其中i取正整数;在所述第i个视频帧满足所述预设跟踪条件时,将所述第i个视频帧加入视频子序列,并继续基于所述预设步长抽取第i+1个视频帧;在所述第i个视频帧不满足所述预设跟踪条件时,将第i个视频帧之前的所述视频帧生成的视频子序列确定为所述2D视频对应的跟踪帧序列。3.根据权利要求2所述的方法,其特征在于,所述预设跟踪条件包括以下条件中的一种或多种的组合:视频帧中的特征点数量大于数量阈值、视频帧对应的光流匹配向量的平均模长小于模长范围的最大值、视频帧对应的内点数量大于内点阈值,以及视频帧对应的帧间旋转角小于角度阈值。4.根据权利要求2所述的方法,其特征在于,在将所述视频子序列确定为所述2D视频对应的跟踪帧序列之前,所述方法还包括:在所述视频子序列的帧数小于最低阈值时,确定所述2D视频帧对应的跟踪帧序列为空;在所述视频子序列的帧数大于或等于所述最低阈值时,确定所述视频子序列为所述2D视频帧对应的跟踪帧序列。5.根据权利要求1所述的方法,其特征在于,所述基于各所述跟踪帧序列进行三维重建,得到重建图像和所述重建图像对应的深度数据,包括:基于各所述跟踪帧序列进行稀疏三维重建,得到稀疏重建结果;基于所述稀疏重建结果进行稠密三维重建,得到稠密重建结果;基于所述稠密重建结果确定重建图像和所述重建图像对应的深度数据。6.根据权利要求5所述的方法,其特征在于,所述基于所述稀疏重建结果进行稠密三维重建,得到稠密重建结果,包括:获取稀疏重建结果中各稀疏点对应的坐标和稀疏深度值;以所述稀疏深度值为所述坐标对应的初始深度值进行稠密三维重建,得到稠密重建结果。7.根据权利要求5所述的方法,其特征在于,在所述基于所述稀疏重建结果进行稠密三维重建,得到稠密重建结果之前,所述方法还包括:基于运动轨迹连续性对所述稀疏重建结果进行筛选,得到筛选后的稀疏重建结果,以基于所述筛选后的稀疏重建结果进行稠密三维重建。
8.根据权利要求5所述的方法,其特征在于,在所述基于所述稠密重建结果确定重建图像和所述重建图像对应的深度数据之前,所述方法还包括:基于语义分割算法对所述稠密重建结果进行清洗,获取清洗后的稠密重建结果,以基于所述清洗后的稠密重建结果确定重建图像和所述重建图像对应的深度数据。9.根据权利要求8所述的方法,其特征在于,所述基于语义分割算法对所述稠密重建结果进行清洗,以获取所述清洗后的稠密重建结果,包括:通过语义分割算法在所述稠密重建结果确定的深度图像中确定第一区域;基于预设算法对所述第一区域进行处理,以消除第二区域对第一区域的深度掺杂,得到清洗后的稠密重建结果...
【专利技术属性】
技术研发人员:李昂,亢兆兵,李姬俊男,汪神岳,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。