当前位置: 首页 > 专利查询>天津大学专利>正文

一种面向自动驾驶环境感知的增量式学习方法和系统技术方案

技术编号:35695482 阅读:20 留言:0更新日期:2022-11-23 14:46
本发明专利技术公开了一种面向自动驾驶环境感知的增量式学习方法和系统,包括:对环境图像数据集中的目标进行类标记,划分已知类和未知类;划分训练集和测试集移除未知类图像;利用高斯混合模型构建混合密度网络,以最小化损失函数为目标对混合密度网络进行优化得到目标检测模型;利用目标检测模型的已知类特征空间和预设高斯混合模型为每个已知类建模,利用最大期望算法对每个已知类的高斯混合模型的参数进行拟合;利用对数似然函数和每个已知类的高斯混合模型估计所有类的认知语义不确定性,循环增量地对认知语义不确定性高的图像人工标注,利用标注后的图像对目标检测模型进一步训练得到最优目标检测模型。本发明专利技术可减少人工标记成本和训练成本。标记成本和训练成本。标记成本和训练成本。

【技术实现步骤摘要】
一种面向自动驾驶环境感知的增量式学习方法和系统


[0001]本专利技术属于图像目标检测
,具体涉及一种面向自动驾驶环境感知的增量式学习方法和系统。

技术介绍

[0002]目前,人工智能(Artificial Intelligence,AI)尤其是机器学习,已经成为计算机视觉、自然语言处理、大数据分析、机器人、软件测试等等领域的不可缺少的重要技术,并在过去的十年里得到了突飞猛进的进步。这在当今学术界、工业界甚至是普通百姓的生活中都产生了重大影响,智能无人系统便是其中典型的应用之一,而环境感知在智能无人系统中更是有着举足轻重的地位。像机器人、自动驾驶汽车、无人机等智能无人系统在行进中需要不断感知周围的环境,精准的环境感知和认知是安全的基础。
[0003]传统的目标检测技术以及机器学习都是针对闭集情况,但在智能无人系统环境感知中,由于环境的变化或者建模的缺陷,智能无人系统像自动驾驶等必然也会面临一些识别不准确或者无法识别的场景,这些场景就属于开放集情况。对于此类场景智能大脑应该能够区分哪些场景是熟悉的,哪些场景是不熟悉的甚至是从未见过的,传统的目标检测技术和机器学习技术解决不了该问题;现有的环境感知目标检测的训练过程大都依赖于已标注类别的训练数据集,而不熟悉的场景和未知场景绝大多数都是没有标注的数据,对这些数据进行类别标注所耗费的人力成本和时间成本非常巨大;在有了新的场景数据的基础上,智能大脑虽然利用部分现有技术能够仅通过新场景数据自主性的进行学习,但常常会忘记旧场景旧知识,从而产生灾难性遗忘。
专利
技术实现思路

[0004]针对以上问题,本专利技术提出了一种面向自动驾驶环境感知的增量式学习方法和系统,主要针对不熟悉场景,智能系统怎样能够自动检测,并提醒用户标注适当数量的样本,进而启动增量学习,以提高模型的性能进行研究,是一种不确定性驱动的增量学习方法。为解决以上技术问题,本专利技术所采用的技术方案如下:
[0005]一种面向自动驾驶环境感知的增量式学习方法,包括如下步骤:
[0006]S1,根据目标检测任务对环境图像数据集中的目标进行类标记,并将标记后的类划分为已知类和未知类,且已知类和未知类属于不同类;
[0007]S2,将划分后的环境图像数据集分为训练集和测试集将训练集和测试集中标记有未知类的图像移除得到训练集和测试集
[0008]S3,利用高斯混合模型构建输出包括均值、方差和混合权重的混合密度网络,利用混合密度网络的输出计算训练集中的每个图像的不确定性,根据不确定性建立第一训练输入图像集,将第一训练输入图像集输入混合密度网络,以最小化损失函数为目标对混合密度网络进行优化得到目标检测模型;
[0009]S4,利用步骤S3得到的目标检测模型生成已知类的特征空间,根据已知类的特征
空间和预设的高斯混合模型为每个已知类建模,利用最大期望算法对每个已知类的高斯混合模型的参数进行拟合;
[0010]S5,将训练集输入目标检测模型,利用对数似然函数和每个已知类的高斯混合模型估计所有类的认知语义不确定性,根据认知语义不确定性建立待标记图像集,对待标记图像集中的图像进行人工标注,利用人工标注后的图像对目标检测模型进一步训练得到最优目标检测模型。
[0011]所述步骤S3包括如下步骤:
[0012]S3.1,以高斯混合模型的参数作为输出构建混合密度网络,执行t=1,并设定精度差阈值和精度差比例阈值
[0013]S3.2,从训练集中随机筛选出S1个图像组成第一训练输入图像集;
[0014]S3.3,将第一训练输入图像集中的图像输入混合密度网络并以最小化损失函数为目标进行训练得到目标检测器;
[0015]S3.4,将测试集中的图像输入目标检测器计算平均精度均值,判断是否满足中的图像输入目标检测器计算平均精度均值,判断是否满足目若是,执行步骤S3.5,否则,输出t

1轮的目标检测器作为目标检测模型,并执行步骤S4,其中,MAP
t
表示第t轮的目标检测器的平均精度均值,MAP
t
‑1表示第t

1轮的目标检测器的平均精度均值,MAP
t
‑2表示第t

2轮的目标检测器的平均精度均值;
[0016]S3.5,判断S2<S1,若是,利用训练集更新第一训练输入图像集,并执行步骤S3.3,否则,利用高斯混合模型的参数计算训练集中除第一训练输入图像集之外的剩余图像的任意不确定性和认知不确定性,其中,S2表示训练集中除第一训练输入图像集之外的剩余图像的数目;
[0017]S3.6,利用Z分数对步骤S3.5计算出的任意不确定性和认知不确定性进行归一化处理,根据归一化后的任意不确定性和认知不确定性确定每个剩余图像的不确定性;
[0018]S3.7,对步骤S3.6得到的每个剩余图像的不确定性按照从高到低的顺序进行排序得到剩余图像不确定性集合,将剩余图像不确定性集合中前S1个不确定性所对应的图像加入第一训练输入图像集得到更新后的第一训练输入图像集,执行t=t+1,并返回步骤S3.3。
[0019]在步骤S3.3中,所述损失函数的计算公式为:
[0020][0021]式中,L
Total
表示总体损失,N表示正匹配的数量,L
loc
(λ,l,g)表示回归任务中基于负对数似然函数的定位损失,λ表示锚框与真实边界框是否匹配的指标参数,g表示真实边界框参数,l表示预测输出边界框所对应的高斯混合模型参数,η表示加权超参数,表示分类任务中正匹配的贡献,表示分类任务中负匹配的贡献,c表示类参数。
[0022]所述回归任务中基于负对数似然函数的定位损失L
loc
(λ,l,g)的计算公式为:
[0023][0024]式中,Pos表示正匹配锚框的集合,表示匹配指标,K表示高斯混合模型的数量,表示第i个锚框的边界框参数b的第k个组件的混合权重,表示第i个锚框的边界框参数b的第k个组件的均值,表示第i个锚框的边界框参数b的第k个组件的方差,表示第j个真实边界框的边界框参数b回归到对应锚框参数的偏移量,ε表示超参数。
[0025]所述分类任务中正匹配的贡献的计算公式为:
[0026][0027]式中,Pos表示正匹配锚框的集合,表示匹配指标,K表示高斯混合模型的数量,π
ik
表示第i个锚框的第k个组件输出的混合权重,表示类别G的第j个真实边界框的真实类,表示第i个锚框的第k个组件的第p类的类概率分布,C表示类的数量;
[0028]所述分类任务中负匹配的贡献的计算公式为:
[0029][0030]式中,M表示难负样本挖掘比,Neg表示负匹配锚框的集合,表示第i个锚框的背景类。
[0031]第k个组件中第p类的类概率分布的计算公式为:
[0032][0033]式中,表示第k个组件的第p类的均值,表示第k个组件的第p类的方差,γ表示辅助噪本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向自动驾驶环境感知的增量式学习方法,其特征在于,包括如下步骤:S1,根据目标检测任务对环境图像数据集中的目标进行类标记,并将标记后的类划分为已知类和未知类,且已知类和未知类属于不同类;S2,将划分后的环境图像数据集分为训练集和测试集将训练集和测试集中标记有未知类的图像移除得到训练集和测试集S3,利用高斯混合模型构建输出包括均值、方差和混合权重的混合密度网络,利用混合密度网络的输出计算训练集中的每个图像的不确定性,根据不确定性建立第一训练输入图像集,将第一训练输入图像集输入混合密度网络,以最小化损失函数为目标对混合密度网络进行优化得到目标检测模型;S4,利用步骤S3得到的目标检测模型生成已知类的特征空间,根据已知类的特征空间和预设的高斯混合模型为每个已知类建模,利用最大期望算法对每个已知类的高斯混合模型的参数进行拟合;S5,将训练集输入目标检测模型,利用对数似然函数和每个已知类的高斯混合模型估计所有类的认知语义不确定性,根据认知语义不确定性建立待标记图像集,对待标记图像集中的图像进行人工标注,利用人工标注后的图像对目标检测模型进一步训练得到最优目标检测模型。2.根据权利要求1所述的面向自动驾驶环境感知的增量式学习方法,其特征在于,所述步骤S3包括如下步骤:S3.1,以高斯混合模型的参数作为输出构建混合密度网络,执行t=1,并设定精度差阈值和精度差比例阈值S3.2,从训练集中随机筛选出S1个图像组成第一训练输入图像集;S3.3,将第一训练输入图像集中的图像输入混合密度网络并以最小化损失函数为目标进行训练得到目标检测器;S3.4,将测试集中的图像输入目标检测器计算平均精度均值,判断是否满足中的图像输入目标检测器计算平均精度均值,判断是否满足且若是,执行步骤S3.5,否则,输出t

1轮的目标检测器作为目标检测模型,并执行步骤S4,其中,MAP
t
表示第t轮的目标检测器的平均精度均值,MAP
t
‑1表示第t

1轮的目标检测器的平均精度均值,MAP
t
‑2表示第t

2轮的目标检测器的平均精度均值;S3.5,判断S2<S1,若是,利用训练集更新第一训练输入图像集,并执行步骤S3.3,否则,利用高斯混合模型的参数计算训练集中除第一训练输入图像集之外的剩余图像的任意不确定性和认知不确定性,其中,S2表示训练集中除第一训练输入图像集之外的剩余图像的数目;S3.6,利用Z分数对步骤S3.5计算出的任意不确定性和认知不确定性进行归一化处理,根据归一化后的任意不确定性和认知不确定性确定每个剩余图像的不确定性;S3.7,对步骤S3.6得到的每个剩余图像的不确定性按照从高到低的顺序进行排序得到剩余图像不确定性集合,将剩余图像不确定性集合中前S1个不确定性所对应的图像加入第一训练输入图像集得到更新后的第一训练输入图像集,执行t=t+1,并返回步骤S3.3。
3.根据权利要求2所述的面向自动驾驶环境感知的增量式学习方法,其特征在于,在步骤S3.3中,所述损失函数的计算公式为:式中,L
Total
表示总体损失,N表示正匹配的数量,L
loc
(λ,l,g)表示回归任务中基于负对数似然函数的定位损失,λ表示锚框与真实边界框是否匹配的指标参数,g表示真实边界框参数,l表示预测输出边界框所...

【专利技术属性】
技术研发人员:胡清华季罗娜
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1