一种利用深度学习重新标注数据集的方法技术

技术编号:29586999 阅读:35 留言:0更新日期:2021-08-06 19:46
本发明专利技术公开一种利用深度学习重新标注数据集的方法,包括获取多标签训练数据集,所述多标签训练数据集的包含类别与目标数据集相同;搭建分类模型,并将所述分类模型在所述多标签训练数据集上进行训练;对目标数据集进行随机裁剪图像增强,并将训练好的分类模型用于目标数据集,得到多标签标注数据集三个步骤,本发明专利技术修改原始分类器模型,在数据集上得到像素级标签。相比于知识蒸馏方法,当使用随机裁剪策略时,知识蒸馏每次都要重新计算得到一个新的特征映射,而本方法对每一张图都对应一个像素级的标签映射,裁剪后的图像只需根据这个标签映射做相应的调整即可得到标签信息,省时省力,效果显著。

【技术实现步骤摘要】
一种利用深度学习重新标注数据集的方法
本专利技术涉及深度学习
,尤其涉及一种利用深度学习重新标注数据集的方法。
技术介绍
随着人工智能的兴起,深度学习、增强学习、机器学习等人工智能领域对数据标注的需求度越来越高,数据标注的重要性也不断凸显。但是其在发展过程中也面临着一些问题和挑战:在早期标注规范还不够严谨的情况下,许多单标签的数据集经常出现图像中存在多个类别却只有一个类别被标注的现象,这些标签噪音会不可避免的对训练过程产生干扰,分类器或者检测器对图像前景背景的区分会变得模糊,从而使得模型的准确性下降。如果使用人工重新标注的话耗时耗力,成本高昂,所以自动且低成本的重新标注数据集方法就十分必要。
技术实现思路
针对上述问题,本专利技术提出一种利用深度学习重新标注数据集的方法,主要解决
技术介绍
中的问题。本专利技术提出一种利用深度学习重新标注数据集的方法,包括以下步骤:S1、获取多标签训练数据集,所述多标签训练数据集的包含类别与目标数据集相同;S2、搭建分类模型,并将所述分类模型在所述多标签训练本文档来自技高网...

【技术保护点】
1.一种利用深度学习重新标注数据集的方法,其特征在于,包括以下步骤:/nS1、获取多标签训练数据集,所述多标签训练数据集的包含类别与目标数据集相同;/nS2、搭建分类模型,并将所述分类模型在所述多标签训练数据集上进行训练;/nS3、对目标数据集进行随机裁剪图像增强,并将训练好的分类模型用于目标数据集,得到多标签标注数据集。/n

【技术特征摘要】
1.一种利用深度学习重新标注数据集的方法,其特征在于,包括以下步骤:
S1、获取多标签训练数据集,所述多标签训练数据集的包含类别与目标数据集相同;
S2、搭建分类模型,并将所述分类模型在所述多标签训练数据集上进行训练;
S3、对目标数据集进行随机裁剪图像增强,并将训练好的分类模型用于目标数据集,得到多标签标注数据集。


2.根据权利要求1所述的一种利用深度学习重新标注数据集的方法,其特征在于,所述分类模型网络采用残差网络,所述分类模型根据数据处理先后顺序包括一个7*7的卷积层、一个最大池化层、四个残差块网络、一个1*1的卷积层。


3.根据权利要求2所述的一种利用深度学习重新标注数据集的方法,其特征在于,所述分类模型的网络输出f(x)为L∈RH×W×C,为lablemap的高度,为labelmap的宽度,代表要分类的类别数量,即输出C张H×W大小的标签映射图。


4.根据权利要求1所述的一种利用深度学习重新标注数据集的方法...

【专利技术属性】
技术研发人员:杨航杨淑爱黄坤山
申请(专利权)人:佛山市南海区广工大数控装备协同创新研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1