【技术实现步骤摘要】
一种可扩展的增量式草坪视频分割方法、装置
[0001]本专利技术涉及图像处理
,具体而言,涉及一种可扩展的增量式草坪视频分割方法、装置。
技术介绍
[0002]在使用深度学习方法的图像领域中,图像数据集是最基础最重要的部分。全景图像数据集因其需要特殊的拍摄设备进行拍摄,有着获取难度较高,图像尺寸比例与传统图像差异较大的特点,难以同传统图像一样进行正常的语义分割任务。
[0003]在实际应用中,由于相机自身分辨率的限制,光照条件,拍摄角度等影响,全景图片的成像质量会受到较大影响,另外,全景相机成像图片的平面展开也对其最终效果有较大影响。因此,亟需提出一种合适的方法对草坪实地全景图像进行较好的平面展开,以更好的进行语义分割等下游任务称为一个颇具挑战的任务。
技术实现思路
[0004]有鉴于此,本专利技术实施例的目的在于提供获取难度较低的平面图像上采集更多的数据,使用增量式的图像获取方法,不断自动标注过程提高语义分割的图像标注精度,减少人工标注成本。
[0005]本专利技术的第一方面提供了一种 ...
【技术保护点】
【技术特征摘要】
1.一种可扩展的增量式草坪视频分割方法,其特征在于,所述方法包括:获取草坪场景的初始数据集,对所述初始数据集执行第一处理,并根据初始数据集对Segformer模型进行训练,获得第一Segformer模型;所述初始数据集包括若干草坪场景图片;获取草坪场景的补充数据集,对所述补充数据集执行第二处理,并根据补充数据集对所述第一Segformer模型进行训练,获得第二Segformer模型;获取历史采集的草坪场景的全景视频,并对所述全景视频执行抽帧展开以及锐化处理,获取展开图像集;基于所述展开图像集,对所述第二Segformer模型进行训练,获得第三Segformer模型;基于所述第二Segformer模型、或第三Segformer模型对后续草坪场景的视频执行语义分割处理。2.根据权利要求1所述的可扩展的增量式草坪视频分割方法,其特征在于,所述基于所述展开图像集,对所述第二Segformer模型进行训练,获得第三Segformer模型,包括:对所述展开图像集执行第三处理;所述第三处理包括调整所述展开图像的宽高比至预定比例,并进行线性插值;根据执行第三处理后的展开图像集,对所述第二Segformer模型进行训练,获得第三Segformer模型。3.根据权利要求2所述的可扩展的增量式草坪视频分割方法,其特征在于,所述基于所述第二Segformer模型、或第三Segformer模型对后续草坪场景的视频执行语义分割处理,包括:获取后续草坪场景的视频,执行分帧处理以及锐化处理,以获取待检测图像;判断待检测图像的宽高比;若所述宽高比大于预定阈值,则确定该视频为全景视频;调整所述待检测图像的宽高比至预定比例,并进行线性插值,并根据第三Segformer模型对所述待检测图像执行语义分割;若所述宽高比小于预定阈值,则确定该视频为普通视频,并根据第二Segformer模型对所述待检测图像执行语义分割。4.根据权利要求1
‑
3任一项所述的可扩展的增量式草坪视频分割方法,其特征在于,所述初始数据集来源于互联网集中下载;所述对所述初始数据集执行第一处理,并根据初始数据集对Segformer模型进行训练,获得第一Segformer模型,包括:对所述初始数据集中的图片执行为每张图片对应一张mask黑白图像,mask图像上的像素值对应类别序号;对初始数据集中的图片进行筛选、整合;对图像的标注进行检查;对标注不符合要求的图片进行随机采样,选取一部分图片进行补充标注,最后合并符合要求的图片,得到符合要求的图片;使用所述符合要求的图片训练得到第一Segformer模型。5.根据权利要求4所述的可扩展的增量式草坪视频分割方法,其特征在于,所述补充数据集是基于使用搜索引擎/网络爬虫按关键字搜索法获取大量草坪相关的图像而形成;
所述根据补充数据集对所述第一Segformer模型进行训练,获得第二Segformer模型,包括:基于像素的相似性设定阈值,设定相似度超过预设...
【专利技术属性】
技术研发人员:曾少宁,朱佳龙,饶云波,吴俊君,
申请(专利权)人:电子科技大学长三角研究院湖州,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。