用于图像分割的方法和装置制造方法及图纸

技术编号：38207473 阅读：14 留言：0更新日期：2023-07-21 16:56

概括地说，本技术一般涉及一种用于训练机器学习ML模型以执行语义图像分割的方法，并且涉及一种使用经过训练的机器学习ML模型来执行语义图像分割的计算机实现的方法和装置。所述训练方法使得语义图像分割ML模型能够更快地进行预测，而不会明显损失精度。所述训练方法还使得所述ML模型能够在具有不同硬件规格，例如，不同的计算能力和内存的装置上实现。不同的计算能力和内存的装置上实现。不同的计算能力和内存的装置上实现。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于图像分割的方法和装置

[0001]本申请一般涉及一种用于生成机器学习ML模型以执行语义图像分割的方法，并且涉及一种使用经过训练的机器学习ML模型来执行语义图像分割的计算机实现的方法。

技术介绍

[0002]语义分割构成了一项核心的机器视觉任务，由于深度学习的出现，这项任务已经取得了明显的进步。语义图像分割网络通过预测任意分辨率图像的密集(每个像素)语义标签来处理最细粒度的视觉场景理解任务。这些密集语义预测可促进与移动增强现实/虚拟现实(AR/VR)应用、自主机器人、导航、语义映射、远程呈现代理、高效视频通信等相关的各种应用。在部署此类实时系统时，服务质量和安全至关重要，这些系统通常运行在资源受限的平台上，诸如智能手机、消费类机器人设备和自主车辆。因此，高效和准确的分割是一个需要解决的核心问题。

技术实现思路

[0003]【技术问题】
[0004]目前的语义分割技术通常包括计算密集型和存储密集型深度学习模型，当部署在消费类设备(诸如智能手机)上时，这些模型经常无法满足应用对延迟的实时要求。特别地，分割输出的每像素性质要求在整个基础神经网络中保留高分辨率的特征图(以避免消除空间信息)，同时还要在输出上保持大的感受域(以结合上下文并实现健壮的语义预测)。因此，得到的网络架构通常由许多层组成，并且经常用增加速率的扩张卷积来代替特征容量的下采样，导致网络更深处的工作负载显著集中，这反过来又导致延迟密集型推理。在中低层设备的情况下，情况会进一步恶化，因为中低层设备的处理能力和内存往往比顶层设备少。因此...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于生成用于语义图像分割的机器学习ML模型的计算机实现的方法，所述方法包括：在主干网络中提供具有多个早期出口的所述ML模型的主干特征提取网络，以生成包括多个候选早期出口分割网络架构的过度供应网络，其中每个早期出口包括定制的网络架构；获得包括多个图像的训练数据集；以及通过以下步骤训练所述ML模型的所述主干网络、最终出口和所述早期出口，以输出输入到所述主干网络中的所述多个图像的特征图：在第一训练阶段，端到端地训练所述主干网络、所述最终出口和所述早期出口；以及在所述端到端训练完成之后，冻结所述主干网络和所述最终出口的权重，并且在第二训练阶段期间，使用所述最终出口作为所述早期出口的老师来单独训练所述早期出口。2.如权利要求1所述的方法，其中所述第一训练阶段包括迭代地训练所述主干网络和早期出口，其中在每次迭代期间，所述训练包括：选择要更新的所述多个早期出口中的一个早期出口；丢弃所述早期出口中的剩余部分的早期出口；以及训练所述主干网络和所选择的早期出口，并更新所述主干网络和选择的早期出口的权重。3.如权利要求2所述的方法，其中对于每个选择的早期出口，在训练所选择的早期出口的每次迭代期间，顺序地丢弃所述早期出口的剩余部分。4.如前述权利要求中任一项所述的方法，其中所述第二训练阶段包括：使用由所述最终出口对图像进行的分割预测，基于对每个像素的所述预测是否正确来确定所述图像中每个像素的难度；以及仅使用其中所述预测正确的所述像素来训练所述早期出口。5.如前述权利要求中任一项所述的方法，还包括执行架构配置搜索，以从所述多个候选早期出口分隔网络架构中识别适合特定应用的架构。6.如权利要求5所述的方法，还包括：接收硬件约束和/或推理性能要求；接收将用于在推理时处理输入图像的特定设备或设备类别的推理设置；以及使用所接收的硬件约束和/或推理性能要求以及所接收的推理设置来执行所述架构配置搜索。7.如权利要求6所述的方法，其中所接收的推理设置是预算推理设置，并且其中所述架构配置搜索输出包括主干特征提取网络和单个早期出口的架构。8.如权利要求6所述的方法，其中所接收的推理设置是随时推理设置，并且其中所述架构配置搜索输出包括主干特征提取网络和多个早期出口的架构。9.如权利要求6所述的方法，其中...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人