一种基于零标注的多类别目标域数据集标注方法及系统技术方案

技术编号:38897650 阅读:16 留言:0更新日期:2023-09-22 14:18
本发明专利技术公开了一种基于零标注的多类别目标域数据集标注方法,包括:获取不同类别的目标域前景图像;基于不同类别的目标域前景图像进行多维空间特征定量化分析并基于分析后的多维空间特征构建跨类别共性描述模型;基于跨类别共性描述模型获得目标的最佳源域;对获得最佳源域的图像进行转换;基于转换后的图像构建目标域合成数据集;基于目标域合成数据集生成目标域标签,并基于目标域合成数据集及目标域标签训练检测模型;基于目标域标签训练检测模型进行目标标注获得已标注的目标域数据集。本发明专利技术还公开了系统、电子设备及计算机可读存储介质,无需人工成本的标注即可实现深度学习模型训练。模型训练。模型训练。

【技术实现步骤摘要】
一种基于零标注的多类别目标域数据集标注方法及系统


[0001]本专利技术涉及图像处理以及智能信息提取
,尤其涉及一种基于零标注的多类别目标域数据集标注方法及系统。

技术介绍

[0002]随着传统农业与人工智能技术相结合,智慧果园的建设在果业发展中得到了更为广泛的关注,其中高精度果实检测技术是现代化智慧果园实际应用工作中的重要基础技术,在果实定位、果实分拣、果实产量预测、果实自动采摘等众多智慧果园智能化工作中有着广泛的应用价值。
[0003]虽然现阶段基于深度学习的目标检测技术得到了广泛的应用,但是需要依赖大量已标注数据集才能支撑检测模型的训练学习,造成人工标注成本增高。并且由于现阶段深度学习模型泛化性能差的原因,针对模型在不同场景、不同环境、不同拍摄方式以及不同目标种类的应用工作中,需要独立制作新的目标数据集并训练学习新的检测模型,耗时耗力。
[0004]目前的技术方向包括:(1)引入实例级损失约束从而更好地规范图像中前景目标的生成方向,但此类做法由于引入了人工标注过程,并不适用于基于无监督学习的果实自动标注任务;(2)采用一种跨循环比较路径的果实转换模型Across

CycleGAN,通过引入结构相似性损失函数从而实现了圆形果实到椭圆形果实的转换;然而目标自动标注方法的泛化性不高,无法实现更多种类目标域目标的自动标注任务。
[0005]因此如何建立一种泛化性更高、域适应性更强的零成本数据自动标注方法,同时能够对生成模型进行优化,从而在多类别(表现在形状颜色纹理变化很大)的情况下,能够实现逼真的转换,实现域差异的减小具有迫切的需求。

技术实现思路

[0006]为了解决现有技术中存在的问题,本专利技术提供了一种基于零标注的多类别目标域数据集标注方法及系统,无需人工成本的标注即可实现深度学习模型的训练,进一步提高无监督目标转换模型性能,增强算法对于目标表型特征的描述能力,从而控制模型在表型特征差异大的跨越式目标图像转换任务中能够精准控制目标生成方向,可应用于多农场、多品种、多场景下的数据集快速标注。
[0007]本专利技术第一方面提供了一种基于零标注的多类别目标域数据集标注方法,包括:
[0008]S1,获取不同类别的目标域前景图像;
[0009]S2,基于所述不同类别的目标域前景图像进行多维空间特征定量化分析并基于定量化分析后的多维空间特征构建跨类别共性描述模型;基于跨类别共性描述模型获得目标的最佳源域;
[0010]S3,基于多类别目标生成模型对最佳源域的图像进行转换;
[0011]S4,基于转换后的图像构建目标域合成数据集;
[0012]S5,基于目标域合成数据集检测目标,得到目标的边界框信息,并基于所述目标域
合成数据集及目标的边界框信息获得目标域标签训练检测模型;
[0013]S6,基于所述目标域标签训练检测模型进行自动的目标标注获得已标注的目标域数据集。
[0014]优选的,所述S2包括:
[0015]S21,从不同类别的目标域前景图像中提取目标的外观特征,所述外观特征包括边缘轮廓、全局颜色和局部细节;
[0016]S22,将所述外观特征抽象为特定形状、颜色和纹理,基于多维特征定量化分析方法对于不同目标的特征计算特定形状、颜色和纹理的相对距离作为不同目标个体的外观特征的分析描述集;
[0017]S23,基于对分析描述集进行多维特征空间重构和特征差异划分构建跨类别共性描述模型;
[0018]S24,基于所述跨类别共性描述模型获得目标的最佳源域;
[0019]优选的,所述S22包括:
[0020]S221,基于傅里叶描述子进行目标形状提取,并将傅里叶描述子离散化;
[0021]S222,提取目标前景中Lab颜色的空间分布及占比,并绘制CIELab空间颜色分布直方图;
[0022]S223,提取目标前景的像素值梯度以及方向导数信息获得基于LBP算法的纹理信息描述;
[0023]S224,基于傅里叶描述子离散化、所绘制的CIELab空间颜色分布直方图以及基于LBP算法的纹理信息描述进行基于相关性和空间分布的单一外观特征相对距离计算;
[0024]S225,基于所计算的单一外观特征相对距离值构建相对距离矩阵;
[0025]所述S23包括:
[0026]S231,多维特征空间重构:通过两两目标特征间的相对距离构建一个多维特征空间,从而将不同目标特征间的相对距离转换为同一特征空间中的绝对距离,便于通过一对二维平面的位置坐标简洁精准的描述每个目标图像的表型特征;
[0027]S232,特征差异划分:基于聚类算法对空间中的特征点进行划分,按照目标特征的相似程度进行聚类,从而得到不同聚类中的最佳源域目标;
[0028]所述S24包括:
[0029]S241,基于所述跨类别共性描述模型对不同目标按照所述外观特征进行分类;
[0030]S242,针对实际需求的目标域种类,从所述分类中选择最佳源域种类,输入到生成模型中进行目标转换,对生成模型进行优化;所述生成模型的优化包括通过基于潜在空间的特征图提取和基于导向梯度信息的可视化特征图提取获得多类别目标域无背景目标多模态图像。
[0031]优选的,所述S3包括将目标样本数据进行图像预处理和图像转换,获取目标域仿真目标、背景以及其他组件形成目标域图像合成组件,包括:
[0032]S31,由模型生成器生成多维损失函数,所述多维损失函数包含三类损失函数,分别为L
Color
(),L
Shape
()以及L
Texture
();
[0033]S32,基于可量化目标表型特征的动态自适应权重方法配平多维损失函数的权重后获得基于熵权法的多维损失函数;
[0034]S33,将所述基于潜在空间的特征图输入配平权重后的基于熵权法的多维损失函数中获得多类别目标域无背景目标图像的子集。
[0035]优选的,所述S4包括:
[0036]基于目标域图像合成组件建立基于层级组件合成规则的知识图谱体系;
[0037]基于层级组件合成规则的知识图谱体系构建合成图像;
[0038]记录目标的位置信息、尺寸信息以及类别信息,将其形成标签数据信息;
[0039]基于合成图像以及标签数据信息形成目标域合成数据集。
[0040]优选的,所述S5包括:
[0041]基于目标域合成数据集检测目标,得到检测算法的预训练模型以及目标的边界框信息;
[0042]基于所检测到的目标的边界框信息进行伪标签自学习生成目标域标签,获得已标注目标域数据集。
[0043]优选的,所述S6中所述目标域标签训练检测模型基于多类别目标自动标注方法搭建,包括:
[0044]将所述目标域标签训练检测模型进行自动的目标标注获得已标注的目标域数据集。
[0045]本专利技术的第二方面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于零标注的多类别目标域数据集标注方法,其特征在于,包括:S1,获取不同类别的目标域前景图像;S2,基于所述不同类别的目标域前景图像进行多维空间特征定量化分析并基于定量化分析后的多维空间特征构建跨类别共性描述模型;基于跨类别共性描述模型获得目标的最佳源域;S3,基于多类别目标生成模型对最佳源域的图像进行转换;S4,基于转换后的图像构建目标域合成数据集;S5,基于目标域合成数据集检测目标,得到目标的边界框信息,并基于所述目标域合成数据集及目标的边界框信息获得目标域标签训练检测模型;S6,基于所述目标域标签训练检测模型进行自动的目标标注获得已标注的目标域数据集。2.根据权利要求1所述的一种基于零标注的多类别目标域数据集标注方法,其特征在于,所述S2包括:S21,从不同类别的目标域前景图像中提取目标的外观特征,所述外观特征包括边缘轮廓、全局颜色和局部细节;S22,将所述外观特征抽象为特定形状、颜色和纹理,基于多维特征定量化分析方法对于不同目标的特征计算特定形状、颜色和纹理的相对距离作为不同目标个体的外观特征的分析描述集;S23,基于对分析描述集进行多维特征空间重构和特征差异划分构建跨类别共性描述模型;S24,基于所述跨类别共性描述模型获得目标的最佳源域。3.根据权利要求2所述的一种基于零标注的多类别目标域数据集标注方法,其特征在于,所述S22包括:S221,基于傅里叶描述子进行目标形状提取,并将傅里叶描述子离散化;S222,提取目标前景中Lab颜色的空间分布及占比,并绘制CIELab空间颜色分布直方图;S223,提取目标前景的像素值梯度以及方向导数信息获得基于LBP算法的纹理信息描述;S224,基于傅里叶描述子离散化、所绘制的CIELab空间颜色分布直方图以及基于LBP算法的纹理信息描述进行基于相关性和空间分布的单一外观特征相对距离计算;S225,基于所计算的单一外观特征相对距离值构建相对距离矩阵;所述S23包括:S231,多维特征空间重构:通过两两目标特征间的相对距离构建一个多维特征空间,从而将不同目标特征间的相对距离转换为同一特征空间中的绝对距离,便于通过一对二维平面的位置坐标简洁精准的描述每个目标图像的表型特征;S232,特征差异划分:基于聚类算法对空间中的特征点进行划分,按照目标特征的相似程度进行聚类,从而得到不同聚类中的最佳源域目标;所述S24包括:S241,基于所述跨类别共性描述模型对不同目标按照所述外观特征进行分类;
S242,针对实际需求的目标域种类,从所述分类中选择最佳源域种类,输入到生成模型中进行目标转换,对生成模型进行优化;所述生成模型的优化包括通过基于潜在空间的特征图提取和基于导向梯度信息的可视化特征图提取获得多类别目标域无背景目标多模态图像。4.根据权利要求1所述的一种基于零标注的多类别目标域数据集标注方法,其特征在于,所述S3包括将目...

【专利技术属性】
技术研发人员:张文利刘鈺昕郑超
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1