图像语义分割模型的训练方法、可读存储介质及电子设备技术

技术编号：19058805 阅读：32 留言：0更新日期：2018-09-29 12:33

一种图像语义分割的训练方法包括：将预先标注语义分割信息的训练图像输入到图像语义分割模型中，得到包含特征图及预测的语义分割结果；将特征图输入到困难样本挖掘单元中，以计算出训练图像的困难样本；依据预测语义分割结果和预先标注的语义分割信息，统计预测错误的像素，将预测语义分割结果中预测错误的像素作为参考困难样本；依据预测语义分割结果和预先标注的语义分割信息、困难样本和参考困难样本，对基础图像语义分割模型及困难样本挖掘单元的参数进行修正。本发明专利技术还提供了一种应用该图像语义分割的训练方法的可读存储介质及电子设备。本发明专利技术图像语义分割模型的训练方法、可读存储介质及电子设备可提高语义分割结果的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
图像语义分割模型的训练方法、可读存储介质及电子设备
本专利技术涉及计算机视觉与图像处理领域，尤其是涉及一种基于像素级困难样本挖掘的图像语义分割模型的训练方法、可读存储介质及电子设备。
技术介绍
图像语义分割是计算机视觉领域中一项重要的研究内容，其目标是将图像分割成具有不同语义信息的区域，并且标注每个区域相应的语义标签，例如通过对一幅图像进行图像语义分割后可为图像中的物体添加语义标签(譬如桌子、墙壁、天空、人、狗等)，可应用于例如无人驾驶等领域。目前，用于图像语义分割的较主流的解决方案主要基于卷积神经网络(ConvolutionalNeuralNetworks，简称CNN)，该网络学习图像的语义特征表示。比如全卷积网络(FullyConvolutionalNetworks，简称为FCN)通过构建包含卷积层、池化层和反卷积层的卷积神经网络，以端到端的方式将任意大小的输入图像转换为像素级的分类结果，为研究人员和工程师提供了一种简单而有效的方法来解决图像语义分割问题。DeepLab和DilatedNet把全卷积网络中普通卷积替换为扩散卷积使得语义分割预测时结合更多的上下文和场景信息。然而，这些模型还存在各种各样的问题，特别是对于复杂的对象和多样的场景。例如全卷积网络忽略了图像的全局信息和潜在有用的场景语义上下文信息，因此容易将一些物体的某些部分错误地标注为其他物体。最近一些学者尝试融合更多的上下文信息和全局信息来解决这些容易预测错误的区域，例如DeepLab和DilatedNet扩大了滤波器的感受野以融合更多的上下文，但遗漏了详细的信息，会把同一个物体预测成多个标...

【技术保护点】
1.一种图像语义分割的训练方法，其特征在于，所述训练方法包括：将预先标注语义分割信息的训练图像输入到图像语义分割模型中，得到包含语义信息的特征图及预测的语义分割结果；将对应所述训练图像的所述特征图输入到困难样本挖掘单元中，以通过所述困难样本挖掘单元计算出所述训练图像的困难样本；依据所述训练图像的所述预测语义分割结果和预先标注的语义分割信息，统计预测错误的像素，将所述预测语义分割结果中预测错误的像素作为参考困难样本；及依据所述训练图像的所述预测语义分割结果和预先标注的语义分割信息、所述计算得到的困难样本和参考困难样本，对所述基础图像语义分割模型及所述困难样本挖掘单元的参数进行修正。

【技术特征摘要】
1.一种图像语义分割的训练方法，其特征在于，所述训练方法包括：将预先标注语义分割信息的训练图像输入到图像语义分割模型中，得到包含语义信息的特征图及预测的语义分割结果；将对应所述训练图像的所述特征图输入到困难样本挖掘单元中，以通过所述困难样本挖掘单元计算出所述训练图像的困难样本；依据所述训练图像的所述预测语义分割结果和预先标注的语义分割信息，统计预测错误的像素，将所述预测语义分割结果中预测错误的像素作为参考困难样本；及依据所述训练图像的所述预测语义分割结果和预先标注的语义分割信息、所述计算得到的困难样本和参考困难样本，对所述基础图像语义分割模型及所述困难样本挖掘单元的参数进行修正。2.如权利要求1所述的图像语义分割的训练方法，其特征在于，所述图像语义分割的训练方法还包括：判断所述基础图像语义分割模型和所述困难样本挖掘单元的训练结果是否满足预设的收敛条件；当所述基础图像语义分割模型和所述困难样本挖掘单元的训练结果未满足预设的收敛条件时，执行所述将预先标注语义分割信息的训练图像输入到图像语义分割模型中，得到包含语义信息的特征图及预测的语义分割结果；或执行依据所述训练图像的所述预测语义分割结果和预先标注的语义分割信息，统计预测错误的像素，将所述预测语义分割结果中预测错误的像素作为参考困难样本。3.如权利要求1所述的图像语义分割的训练方法，其特征在于，所述将预先标注语义分割信息的训练图像输入到图像语义分割模型中，得到包含语义信息的特征图及预测的语义分割结果包括：通过卷积模块及卷积层对所述训练图像进行卷积操作，以生成对应的特征图；通过反卷积层对所述特征图进行上采样，以生成与训练图像相同尺寸图像。4.如权利要求3所述的图像语义分割的训练方法，其特征在于，所述困难样本挖掘单元接收所述卷积模块生成的特征图，以计算出所述训练图像的困难样本。5.如权利要求1所述的图像语义分割的训练方法，其特征在于，所述将对应所述训练图像的所...

【专利技术属性】
技术研发人员：袁春，黎健成，
申请(专利权)人：清华大学深圳研究生院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人