一种图像标定模型的训练方法和装置制造方法及图纸

技术编号：19904429 阅读：24 留言：0更新日期：2018-12-26 03:12

本发明专利技术公开一种图像标定模型的训练方法和装置，以解决现有图像分类标定技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。该方法包括：在当前的迭代处理中，图像标定模型对接收到的图像数据进行自动图像标定处理；评估模块对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值；在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理，将人工标定图像数据作为训练数据发送给图像标定模型；图像标定模型根据训练数据进行再次训练得到更新的图像标定模型，用于下一次迭代处理。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像标定模型的训练方法和装置
本专利技术涉及计算机视觉领域，特别涉及一种图像标定模型的训练方法和装置。
技术介绍
在计算机视觉技术中，通常会采用图像语义分割来识别出图像中的物体。图像语义分割技术通过给图像中的每个像素标定一种语义类别，来标识出图像中与物体直接对应的图像区域。不同于仅仅识别出图像中物体的物体识别技术，语义分割给每个像素分配一个类别标签以标明像素所属的物体。语义分割技术在图像分析和自动驾驶系统中起到重要作用。研究人员研发出了一系列的弱监督分割算法。弱监督分割算法的主要思想在于，获取一个已知包含同类物体类别的图像池，挖掘得到重复的模式以联合分割出每个图像的前景。在一方面，该模式由于只需要较少的人工参与而具有吸引性，尤其是这种弱标定图像可以很容易地通过关键词搜索从网络上获取得到。在另一方面，分割结果是不理想的。从而，现有的图像标定技术依赖于人工提供的分类或者自动分类，人工分类是准确的、但是人工消耗很大，自动分类的人工开销小、但是非常不准确。可见，在现有的图像分类标定技术中存在人工标定分类的开销大、自动标定分类的准确率低的问题。
技术实现思路
有鉴于此，本专利技术提供了一种图像标定模型的训练方法和装置，用以解决现有图像分类标定技术中存在的人工标定分类的开销大、自动标定分类的准确率低的问题。根据本申请的一个方面，提供了一种图像标定模型的训练方法，包括：在当前的迭代处理中，图像标定模型对接收到的图像数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出；评估模块根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的...

【技术保护点】
1.一种图像标定模型的训练方法，其特征在于，包括：在当前的迭代处理中，图像标定模型对接收到的图像数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出；评估模块根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值；在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理；接收来自人工标定处理的人工标定图像数据，人工标定图像数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型；图像标定模型根据训练数据，对低确定性区域的图像数据进行再次训练，得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。

【技术特征摘要】
2017.06.14 US US15/623,3231.一种图像标定模型的训练方法，其特征在于，包括：在当前的迭代处理中，图像标定模型对接收到的图像数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出；评估模块根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值；在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理；接收来自人工标定处理的人工标定图像数据，人工标定图像数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型；图像标定模型根据训练数据，对低确定性区域的图像数据进行再次训练，得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。2.根据权利要求1所述的方法，其特征在于，确定区域的输出评估值，包括：根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；其中，预测输出包括：预测值或者预测方差；根据该区域中的各像素的输出评估值，确定该区域的输出评估值。3.根据权利要求2所述的方法，其特征在于，确定像素的输出评估值，包括：对于一个像素，确定该像素的相邻像素的预测值均值；将该像素的预测值和该像素的相邻像素的预测值均值作为决策树的输入，确定该像素的输出评估值；或者，对于一个像素，将该像素的预测方差和该像素的相邻像素的预测方差作为决策树的输入，确定该像素的输出评估值。4.根据权利要求3所述的方法，其特征在于，确定像素的输出评估值，还包括：该像素的相邻像素中不包括物体边缘像素。5.根据权利要求2所述的方法，其特征在于，确定区域的输出评估值，包括：根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值；或者，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值。6.根据权利要求5所述的方法，其特征在于，根据一个区域中的像素的输出评估值使用启发式方法确定该区域的输出评估值，包括：将一个区域中的全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中不包括物体边界像素的其它全部像素的输出评估值的均值确定为该区域的输出评估值；或者，将一个区域中的全部像素的输出评估值的第三四分位数确定为该区域的输出评估值。7.根据权利要求5所述的方法，其特征在于，根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用基于学习的方法确定该区域的输出评估值，包括：根据一个区域中的像素的输出评估值以及该区域的历史标定数据，使用高斯函数或者朴素贝叶斯函数确定该区域的输出评估值。8.根据权利要求1所述的方法，其特征在于，所述区域为预定区域、使用滑动窗口获得的区域或者是随机生成的区域。9.根据权利要求1所述的方法，其特征在于，所述预定评估阈值是预先根据区域的大小尺寸预先确定的一个归一化值。10.根据权利要求1所述的方法，其特征在于，自动图像标定处理包括语义分割处理，自动标定图像数据包括语义标签图像数据。11.一种图像标定模型的训练装置，其特征在于，包括：图像标定模型模块和评估模块；其中，图像标定模型模块，用于在当前的迭代处理中，对接收到的图像数据进行自动图像标定处理，得到自动标定图像数据和自动标定图像数据中各像素的预测输出；评估模块，用于根据自动标定图像中各像素的预测输出，对自动标定图像数据中多个区域的图像数据进行评估，确定各区域的输出评估值；在判断一个区域的输出评估值小于预定评估阈值的情况下，确定该区域为低确定性区域；从自动标定图像数据中抽取出低确定性区域的数据，并将抽取出来的区域的数据发送给一个人工标定处理；接收来自人工标定处理的人工标定图像数据，人工标定图像数据与抽取出来的区域相对应，将人工标定图像数据作为训练数据发送给图像标定模型模块；图像标定模型模块，还用于根据来自接收模块的训练数据，对低确定性区域的图像数据进行再次训练，得到更新的图像标定模型，更新的图像标定模型用于下一次迭代处理。12.根据权利要求11所述的装置，其特征在于，评估模块确定区域的输出评估值，包括：根据一个区域中一个像素的预测输出和该像素的相邻像素的预测输出，确定该像素的输出评估值；其中，预测输出包括：预测值或者预测方差；根据该区域中的各像素的输出评估值，确定该区域的输出评估值。13.根据权利要求12所述的装置，其特征在于，评估模块确定像素的输出评估值，包括：对于一个像素，确定该像素的相邻像素的...

【专利技术属性】
技术研发人员：阎志鹏，黄泽铧，陈鹏飞，王泮渠，
申请(专利权)人：北京图森未来科技有限公司，图森公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人