System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及计算机视觉,尤其是涉及一种尾部类样本标注方法、装置、电子设备和存储介质。
技术介绍
1、随着深度学习理论和相关技术的蓬勃发展,计算机视觉方面取得了巨大的进展。深度卷积神经网络的提出,让计算机视觉研究有了跨越性发展,使得目标检测和图像分类实现应用落地成为现实。随着数据集的不断扩大,目标检测和图像分类的准确性大大提高,人们能够更好地利用深度学习技术来解决问题。
2、数据集中的样本数据通常呈现较极端的不平衡现象,即长尾分布形态,头部类别虽然类别数目少(一般在10%以下),却拥有90%以上的数据量,尾部类别数目多(通常在90%左右),却只拥有10%左右的数据量。尾部类样本虽然占比少,对提升深度卷积神经网络的准确性却十分重要,现有数据样本标注公司花费大量人力和时间标注头部类样本,忽略了尾部类样本,导致深度卷积神经网络的准确性大大降低。
技术实现思路
1、本公开提供了一种尾部类样本标注方法、装置、电子设备和存储介质,以解决专利技术人认识到的数据样本标注公司花费大量人力和时间标注头部类样本,忽略了尾部类样本,导致深度卷积神经网络的准确性大大降低的技术问题。
2、本公开提供了一种尾部类样本标注方法,包括:
3、获取待标注样本,对所述待标注样本进行目标检测,得到目标检测区域样本;
4、基于预设的特征编码器分别对所述目标检测区域样本和预设样本进行特征提取,得到第一样本特征数据和第二样本特征数据,对所述第一样本特征数据和所述第二样本特征数据进行匹
5、根据所述匹配结果对所有所述目标检测区域样本进行筛选,得到尾部类样本;
6、基于所述预标注标签对所述尾部类样本进行标注。
7、在上述任一技术方案中,进一步地,所述特征编码器包括输入模块、编码模块和输出模块;
8、所述输入模块用于对所述目标检测区域样本和所述预设样本进行下采样,得到第一输入特征向量和第二输入特征向量;
9、所述编码模块用于对所述第一输入特征向量和所述第二输入特征向量进行卷积编码处理,得到第一特征编码向量和第二特征编码向量;
10、所述输出模块用于根据所述第一特征编码向量和所述第二特征编码向量之间的特征距离,确定与所述待标注样本的特征距离最近的目标预设样本,将所述目标预设样本对应的预标注标签作为所述匹配结果。
11、在上述任一技术方案中,进一步地,所述输入模块包括输入卷积层。
12、在上述任一技术方案中,进一步地,所述编码模块包括多个预设的特征编码模块,两个所述特征编码模块构成卷积编码层,两个所述卷积编码层之间连接有用于下采样的全局平均池化层。
13、在上述任一技术方案中,进一步地,所述特征编码模块包括多维度卷积模块以及与所述多维度卷积模块连接的动态共享残差模块,多维度卷积模块由多组递进式卷积层构成。
14、在上述任一技术方案中,进一步地,所述特征编码器的训练步骤包括:
15、获取预设物体在随机角度下的图片以及所述预设物体对应类别的样品图库图片,构建数据集;
16、基于所述数据集和预设分类器对所述特征编码器进行训练,其中,在每次迭代训练过程中随机从所述数据集中选择训练图片,并优化预设目标函数。
17、在上述任一技术方案中,进一步地,所述根据所述匹配结果对所有所述目标检测区域样本进行筛选,得到尾部类样本,包括:
18、从所述所有所述目标检测区域样本过滤所述预标注标签为头部类的样本数据,将过滤后的所述目标检测区域样本作为所述尾部类样本。
19、本公开还提供了一种尾部类样本标注装置,包括:
20、检测模块,用于获取待标注样本,对所述待标注样本进行目标检测,得到目标检测区域样本;
21、匹配模块,用于基于预设的特征编码器分别对所述目标检测区域样本和预设样本进行特征提取,得到第一样本特征数据和第二样本特征数据,对所述第一样本特征数据和所述第二样本特征数据进行匹配,得到匹配结果,所述匹配结果用于表征所述目标预设样本对应的预标注标签;
22、筛选模块,用于根据所述匹配结果对所有所述目标检测区域样本进行筛选,得到尾部类样本;
23、标注模块,用于基于所述预标注标签对所述尾部类样本进行标注。
24、本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述尾部类样本标注方法。
25、本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述尾部类样本标注方法。
26、本公开的有益效果主要在于:
27、采用特征编码匹配的方式进行预标注,能省去标注头部类数据所耗费的人工成本,待标注样本中只有尾部类数据,预标注后的待标注数据采用最简单的标注方式,降低了标注者的门槛,极大减少了标注者操作的时间,从而有效降低成本,本公开对尾部类样本进行标注,能够提高深度卷积神经网络的准确性。
28、应当理解,前述的一般描述和接下来的具体实施方式两者均是为了举例和说明的目的并且未必限制本公开。并入并构成说明书的一部分的附图示出本公开的主题。同时,说明书和附图用来解释本公开的原理。
本文档来自技高网...【技术保护点】
1.一种尾部类样本标注方法,其特征在于,包括:
2.根据权利要求1所述的尾部类样本标注方法,其特征在于,所述特征编码器包括输入模块、编码模块和输出模块;
3.根据权利要求2所述的尾部类样本标注方法,其特征在于,所述输入模块包括输入卷积层。
4.根据权利要求2所述的尾部类样本标注方法,其特征在于,所述编码模块包括多个预设的特征编码模块,两个所述特征编码模块构成卷积编码层,两个所述卷积编码层之间连接有用于下采样的全局平均池化层。
5.根据权利要求4所述的尾部类样本标注方法,其特征在于,所述特征编码模块包括多维度卷积模块以及与所述多维度卷积模块连接的动态共享残差模块,多维度卷积模块由多组递进式卷积层构成。
6.根据权利要求2所述的尾部类样本标注方法,其特征在于,所述特征编码器的训练步骤包括:
7.根据权利要求1所述的尾部类样本标注方法,其特征在于,所述根据所述匹配结果对所有所述目标检测区域样本进行筛选,得到尾部类样本,包括:
8.一种尾部类样本标注装置,其特征在于,包括:
9.一种电子设备,
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述尾部类样本标注方法。
...【技术特征摘要】
1.一种尾部类样本标注方法,其特征在于,包括:
2.根据权利要求1所述的尾部类样本标注方法,其特征在于,所述特征编码器包括输入模块、编码模块和输出模块;
3.根据权利要求2所述的尾部类样本标注方法,其特征在于,所述输入模块包括输入卷积层。
4.根据权利要求2所述的尾部类样本标注方法,其特征在于,所述编码模块包括多个预设的特征编码模块,两个所述特征编码模块构成卷积编码层,两个所述卷积编码层之间连接有用于下采样的全局平均池化层。
5.根据权利要求4所述的尾部类样本标注方法,其特征在于,所述特征编码模块包括多维度卷积模块以及与所述多维度卷积模块连接的动态共享残差模块,多维度卷积模块由多组递进式卷积层构成。
【专利技术属性】
技术研发人员:陆铿宇,吴博文,刘嘉杰,龚科,
申请(专利权)人:拓元广州智慧科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。