当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于伪标签的3D点云数据半自动标注方法及装置制造方法及图纸

技术编号:31793100 阅读:11 留言:0更新日期:2022-01-08 10:52
本发明专利技术公开了一种基于伪标签的3D点云数据半自动标注方法及装置,方法包括:使用标注后的点云数据对3D点云语义理解模型进行训练,将训练后的模型记作初语义理解模型,所述初语义理解模型对剩余未标注数据进行语义理解,得到伪标签点云;根据不确定性度量阈值和伪标签阈值将伪标签点云分为高信度伪标签点云和低信度伪标签点云;使用所述标注后的点云数据和高信度伪标签点云数据重新对初语义理解模型进行训练,将训练后的模型记作伪标签语义理解模型;使用所述标注后点云数据和初始未标注数据对所述伪标签语义理解模型继续训练,将再次更新后的模型记作强伪标签语义理解模型,并用该最终的模型对初始未标注数据进行标注。装置包括:处理器和存储器。处理器和存储器。处理器和存储器。

【技术实现步骤摘要】
一种基于伪标签的3D点云数据半自动标注方法及装置


[0001]本专利技术涉及半自动标注领域,尤其涉及一种基于伪标签的3D点云数据半自动标注方法及装置。

技术介绍

[0002]随着人工智能技术的发展,涌现出越来越多性能优越的机器学习模型,但其中多数机器学习模型都是需要大量的人工标注的数据,这对于人工智能技术的实际应用带来了极大挑战。模型的训练需要大量的标注数据,并且标注数据的准确率和正确率直接影响了模型训练的好坏。在计算机视觉领域,基于强监督的3D点云语义理解模型准确率已相对成熟,这也对于有标注数据的依赖性越来越大,对于如此大量的强监督标注数据一般都是需要花费大量的人力物力以及资源成本才可以获得,并且3D点云数据的标注在时间成本和金钱成本上都远远高于图像数据。
[0003]因此,只利用少量标注3D点云数据便可对大量未标记3D点云数据进行标注,实现3D点云数据的半自动标注。

技术实现思路

[0004]本专利技术提供了一种基于伪标签的3D点云数据半自动标注方法及装置,本专利技术前期使用一定量的3D点云标注数据,然后结合伪标签和无标签损失改善了模型,从而在使用少量标注数据的同时,保证了精度;本专利技术设计了一种转换方式,使得强监督训练模型可以在使用少量强监督信息、多数弱监督信息及大量无监督信息的情况下对模型有很好的训练,详见下文描述:
[0005]第一方面,一种基于伪标签的3D点云数据半自动标注方法,所述方法包括:
[0006]使用标注后的点云数据对3D点云语义理解模型进行训练,将训练后的模型记作初语义理解模型,所述初语义理解模型对剩余未标注数据进行语义理解,得到伪标签点云;
[0007]根据不确定性度量阈值和伪标签阈值将伪标签点云分为高信度伪标签点云和低信度伪标签点云;
[0008]使用所述标注后的点云数据和高信度伪标签点云数据重新对初语义理解模型进行训练,将训练后的模型记作伪标签语义理解模型;
[0009]使用所述标注后点云数据和初始未标注数据对所述伪标签语义理解模型继续训练,将再次更新后的模型记作强伪标签语义理解模型,并用该最终的模型对初始未标注数据进行标注。
[0010]在一种实施方式中,所述方法在对伪标签点云进行高信度和低信度分类的过程中,所述不确定性度量阈值利用了边缘采样法。
[0011]在一种实施方式中,所述方法在训练伪标签语义理解模型的过程中,采用了标注点云数据和高信度伪标签点云数据的等权混合训练。
[0012]在一种实施方式中,所述方法在对所述伪标签语义理解模型继续训练的过程中,
在损失函数中加入了无标签损失函数香农熵。
[0013]其中,所述使用标注后的点云数据对3D点云语义理解模型进行训练具体为:
[0014]使用标注后的点云数据训练3D点云语义理解模型,并用该模型对初始伪标签数据打上伪标签,并用脚本从ShapeNet数据集中将伪标签的原始数据选出,分别存储于高信度伪标签数据和低信度伪标签数据中。
[0015]优选地,所述方法通过一映射函数D1=X1‑
X2计算点不确定性度量,其中X1为特征向量中的最大值,X2为特征向量中的第二大值,将计算出的点不确定性度量和不确定性度量阈值进行比较,高于称为高信度点H
P
,反之称为低信度点L
P

[0016]通过映射函数P=H
P
/(H
P
+L
P
)计算点云伪标签信度,并将点云伪标签信度和伪标签阈值进行比较,高于称为高信度伪标签点云。
[0017]第二方面,一种基于伪标签的3D点云数据半自动标注装置,所述装置包括:
[0018]标注模块,用于对所收集到的初始3D点云数据进行标注,提供监督信息;
[0019]强监督模块,用于通过有标注的3D点云强监督信息对3D点云网络结构进行训练,产生具有3D点云语义理解能力的初语义理解模型;
[0020]伪标签模块,用于对收集到的初始3D点云数据进行打伪标签操作,得到具有弱监督信息的伪标签标注的3D点云数据;
[0021]不确定性模块,用于对伪标签标注的3D点云数据计算不确定性度,并将其分为高信度伪标签数据和低信度伪标签数据,分别存储,包括:点不确定性层、点云伪标签层;
[0022]弱监督模块,用于通过初始有标注和高信度伪标签3D点云数据对3D点云网络结构进行训练,产生具有3D点云语义理解能力的伪标签语义理解模型;
[0023]半监督模块,用于通过初始有标注和未标注3D点云数据对伪标签语义理解模型继续训练,产生具有对未标注数据有良好性能的强伪标签语义理解模型;
[0024]重标注模块,用于对初始未标注3D点云数据利用强伪标签语义理解模型重新进行标注,并输出标注结果。
[0025]其中,所述不确定性模块包括:
[0026]点不确定性度量阈值子模块,用于计算3D点云数据中每个点的不确定性度量,并对每个点做出分类,包括点不确定性层;
[0027]点云伪标签阈值子模块,用于判断3D点云数据是高信度伪标签点云还是低信度伪标签点云,包括点云伪标签层;
[0028]其中,点不确定层采用边缘采样法计算点的不确定性度量,以特征向量作为输入,通过一个映射函数输出两个标量;
[0029]通过映射函数D1=X1‑
X2,计算点不确定性度量D1,X1为特征向量中的最大值,X2为特征向量中的最小值,并将点不确定性度D1和不确定性阈值进行比较,高于称为高信度点;
[0030]其中,点云伪标签层采用占比法计算点云伪标签高低信度,以点不确定性层的输出作为输入,通过一个二分类器输出一个标量;
[0031]通过映射函数P
L
=H
P
/(H
P
+L
P
)计算点云伪标签信度P
L
,并将P
L
和伪标签阈值进行比较,高于则称为高信度伪标签点云。
[0032]第三方面,一种基于伪标签的3D点云数据半自动标注装置,所述装置包括处理器和存储器,存储器中存储有程序指令,处理器调用存储器中存储的程序指令以使装置执行
第一方面中的任一项所述的方法步骤。
[0033]第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时使所述处理器执行第一方面中的任一项所述的方法步骤。
[0034]本专利技术提供的技术方案的有益效果是:
[0035]1、本专利技术将含弱监督信度的伪标签数据和无监督信息的无标注数据应用到强监督3D点云语义理解模型中,提出了一种可以用少量含强监督信息的有标注数据、多数含弱监督信息的伪标签数据和大量含无监督信息的无标注数据,在现有强监督3D点云语义理解模型的基础上训练的方法,打破了强监督学习、弱监督学习和无监督学习的界限,使得三者之间可以更好的协同联系,共同促进模型精度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于伪标签的3D点云数据半自动标注方法,其特征在于,所述方法包括:使用标注后的点云数据对3D点云语义理解模型进行训练,将训练后的模型记作初语义理解模型,所述初语义理解模型对剩余未标注数据进行语义理解,得到伪标签点云;根据不确定性度量阈值和伪标签阈值将伪标签点云分为高信度伪标签点云和低信度伪标签点云;使用所述标注后的点云数据和高信度伪标签点云数据重新对初语义理解模型进行训练,将训练后的模型记作伪标签语义理解模型;使用所述标注后点云数据和初始未标注数据对所述伪标签语义理解模型继续训练,将再次更新后的模型记作强伪标签语义理解模型,并用该最终的模型对初始未标注数据进行标注。2.根据权利要求1所述的一种基于伪标签的3D点云数据半自动标注方法,其特征在于,所述方法在对伪标签点云进行高信度和低信度分类的过程中,所述不确定性度量阈值利用了边缘采样法。3.根据权利要求1所述的一种基于伪标签的3D点云数据半自动标注方法,其特征在于,所述方法在训练伪标签语义理解模型的过程中,采用了标注点云数据和高信度伪标签点云数据的等权混合训练。4.根据权利要求1所述的一种基于伪标签的3D点云数据半自动标注方法,其特征在于,所述方法在对所述伪标签语义理解模型继续训练的过程中,在损失函数中加入了无标签损失函数香农熵。5.根据权利要求1所述的一种基于伪标签的3D点云数据半自动标注方法,其特征在于,所述使用标注后的点云数据对3D点云语义理解模型进行训练具体为:使用标注后的点云数据训练3D点云语义理解模型,并用该模型对初始伪标签数据打上伪标签,并用脚本从ShapeNet数据集中将伪标签的原始数据选出,分别存储于高信度伪标签数据和低信度伪标签数据中。6.根据权利要求1或2所述的一种基于伪标签的3D点云数据半自动标注方法,其特征在于,所述方法通过一映射函数D1=X1‑
X2计算点不确定性度量,其中X1为特征向量中的最大值,X2为特征向量中的第二大值,将计算出的点不确定性度量和不确定性度量阈值进行比较,高于称为高信度点H
P
,反之称为低信度点L
P
;通过映射函数P=H
P
/(H
P
+L
P
)计算点云伪标签信度,并将点云伪标签信度和伪标签阈值进行比较,高于称为高信度伪标签点云。7.一种基于伪标签的3D点云数据半自动标注装置,其特征在于,所述装置包括:标注模块,用于对所收集到的初始3D点云数据进行标注,提供监督信息;强监督模块,用于通过有标注的...

【专利技术属性】
技术研发人员:朱鹏飞李景晴范妍胡清华
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1