一种训练集数据的标注方法及装置制造方法及图纸

技术编号:21972863 阅读:40 留言:0更新日期:2019-08-28 01:46
本发明专利技术实施例公开一种训练集数据的标注方法及装置。该方法包括:根据已标注的样本激光点云数据和标准标注框,对目标网络模型进行训练,得到更新后的网络模型;当待标注数据集中未标注的样本激光点云数据的数量大于第一数量时,从未标注的样本激光点云数据中确定第二样本激光点云数据,由更新后的网络模型确定第二样本激光点云数据中待标注对象的参考标注框;根据第一映射关系将第二样本激光点云数据和参考标注框显示在二维俯视界面中,根据标注员针对参考标注框的第一调整操作,确定标准标注框;将第二样本激光点云数据和对应的标准标注框加入所述训练集;重复执行上述过程。应用本发明专利技术实施例提供的方案,能够提高训练集数据的标注效率。

A Method and Device for Marking Training Set Data

【技术实现步骤摘要】
一种训练集数据的标注方法及装置
本专利技术涉及智能驾驶
,具体而言,涉及一种训练集数据的标注方法及装置。
技术介绍
在机器学习领域中,训练集数据包含了用于训练网络模型的大量样本数据。对训练集数据进行标注是目前人工智能行业中不可或缺的一环,而目前国内外数据标注工作多采用众包、外包等人工标注方案。上述方案需要雇佣大量的人力资源才能满足在机器学习不断迭代过程中的标注需求,其效率低下。当待标注的数据为激光点云数据时,人工标注的过程将更加复杂。激光点云数据是激光雷达返回的数据类型,激光点云包括大量激光点数据。激光雷达可以安装在智能车辆、机器人等设备中,用于根据采集设备周围的激光点云数据,根据激光点云数据可以确定设备周围的障碍物信息。所收集到的激光点云数据信息量通常过多过杂,难以直接使用,需要人工对其进行识别和标注。在实际操作时,通常需要在三维界面中标注出对象的立体包围框。在标注立体包围框时比较困难,需要标注人员多次调整。面对大量、庞杂的激光点云数据,这种对数据标注的方式效率较低。为了解决这种训练集数据标注中的效率问题,亟需一种提高训练集数据的标注效率的标注方法。
技术实现思路
本专利技术提供了一种训练集数据的标注方法及装置,以提高训练集数据的标注效率。具体的技术方案如下。第一方面,本专利技术实施例公开了一种训练集数据的标注方法,包括:获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据;根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型;其中,所述更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联;判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量;如果大于,则从所述待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定所述第二样本激光点云数据中待标注对象的参考标注框;根据二维俯视坐标系与三维坐标系之间的第一映射关系,将所述第二样本激光点云数据和参考标注框显示在二维俯视界面中;其中,所述三维坐标系为所述第二样本激光点云数据所在的坐标系,所述二维俯视界面与所述二维俯视坐标系对应;获取标注员针对所述二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框;将所述第二样本激光点云数据和对应的标准标注框加入所述训练集;将所述第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行所述根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型的步骤。可选的,在确定所述第二样本激光点云数据中待标注对象的参考标注框之后,所述方法还包括:将所述第二样本激光点云数据显示在三维界面中;其中,所述三维界面与所述三维坐标系对应;所述根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框的步骤,包括:根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第一待调整标注框;在所述三维界面中显示所述第一待调整标注框;获取标注员针对所述三维界面中显示的第一待调整标注框输入的第二调整操作,根据所述第二调整操作,对所述第一待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。可选的,所述根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框的步骤,包括:根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第二待调整标注框;确定所述第二待调整标注框的其他面所在的其他二维坐标系与所述三维坐标系之间的第二映射关系;其中,所述其他面包括背面和/或侧面,所述其他二维坐标系包括:二维背视坐标系和/或二维侧视坐标系;根据所述第二映射关系,将所述第二样本激光点云数据和所述第二待调整标注框显示在与所述其他二维坐标系对应的其他二维界面中;获取标注员针对所述其他二维界面显示的第二待调整标注框输入的第三调整操作;根据所述第三调整操作对所述第二待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。可选的,当更新后的网络模型确定所述第二样本激光点云数据中不存在待标注对象时,所述方法还包括:将所述第二样本激光点云数据加入负样本训练集中;所述负样本训练集中的样本激光点云数据拒绝针对标注员进行显示。可选的,所述根据所述模型训练数据,对目标网络模型进行训练的步骤,包括:将所述模型训练数据中的样本激光点云数据输入目标网络模型中;所述目标网络模型包括特征提取层和回归层;通过所述特征提取层的第一模型参数,确定所述样本激光点云数据中的特征向量;通过所述回归层的第二模型参数,对所述特征向量进行回归,得到初始标注框;确定所述初始标注框与所述模型训练数据中样本激光点云数据对应的标准标注框之间的差异;当所述差异大于预设差异阈值时,根据所述差异修改所述第一模型参数和所述第二模型参数,返回执行所述将所述样本激光点云数据输入目标网络模型中的步骤;当所述差异不大于预设差异阈值时,确定所述目标网络模型训练完成。可选的,当所述待标注数据集中未标注的样本激光点云数据的数量不大于第一数量时,所述方法还包括:将所述待标注数据集中未标注的样本激光点云数据作为第三样本激光点云数据,直接显示所述第三样本激光点云数据;获取标注员针对所述第三样本激光点云数据输入的标注操作;根据所述标注操作,确定针对所述第三样本激光点云数据的待标注对象的标准标注框;将所述第三样本激光点云数据和对应的标准标注框加入所述训练集。第二方面,本专利技术实施例公开了一种训练集数据的标注装置,包括:数据获取模块,被配置为获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据;模型训练模块,被配置为根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型;其中,所述更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联;数量判断模块,被配置为判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量;参考框确定模块,被配置为当所述待标注数据集中未标注的样本激光点云数据的数量大于第一数量时,从所述待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定所述第二样本激光点云数据中待标注对象的参考标注框;二维显示模块,被配置为根据二维俯视坐标系与三维坐标系之间的第一映射关系,将所述第二样本激光点云数据和参考标注框显示在二维俯视界面中;其中,所述三维坐标系为所述第二样本激光点云数据所在的坐标系,所述二维俯视界面与所述二维俯视坐标系对应;标准框确定模块,被配置为获取标注员针对所述二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框;第一加入模块,被配置为将所述第二样本激光点云数据和对应的标准标注框加入所述训练集;数据更新模块,被配置为将所述第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行所述根据所述模型训练数据,对本文档来自技高网...

【技术保护点】
1.一种训练集数据的标注方法,其特征在于,包括:获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据;根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型;其中,所述更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联;判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量;如果大于,则从所述待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定所述第二样本激光点云数据中待标注对象的参考标注框;根据二维俯视坐标系与三维坐标系之间的第一映射关系,将所述第二样本激光点云数据和参考标注框显示在二维俯视界面中;其中,所述三维坐标系为所述第二样本激光点云数据所在的坐标系,所述二维俯视界面与所述二维俯视坐标系对应;获取标注员针对所述二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框;将所述第二样本激光点云数据和对应的标准标注框加入所述训练集;将所述第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行所述根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型的步骤。...

【技术特征摘要】
1.一种训练集数据的标注方法,其特征在于,包括:获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据;根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型;其中,所述更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联;判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量;如果大于,则从所述待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定所述第二样本激光点云数据中待标注对象的参考标注框;根据二维俯视坐标系与三维坐标系之间的第一映射关系,将所述第二样本激光点云数据和参考标注框显示在二维俯视界面中;其中,所述三维坐标系为所述第二样本激光点云数据所在的坐标系,所述二维俯视界面与所述二维俯视坐标系对应;获取标注员针对所述二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框;将所述第二样本激光点云数据和对应的标准标注框加入所述训练集;将所述第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行所述根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型的步骤。2.如权利要求1所述的方法,其特征在于,在确定所述第二样本激光点云数据中待标注对象的参考标注框之后,所述方法还包括:将所述第二样本激光点云数据显示在三维界面中;其中,所述三维界面与所述三维坐标系对应;所述根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框的步骤,包括:根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第一待调整标注框;在所述三维界面中显示所述第一待调整标注框;获取标注员针对所述三维界面中显示的第一待调整标注框输入的第二调整操作,根据所述第二调整操作,对所述第一待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。3.如权利要求1所述的方法,其特征在于,所述根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框的步骤,包括:根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第二待调整标注框;确定所述第二待调整标注框的其他面所在的其他二维坐标系与所述三维坐标系之间的第二映射关系;其中,所述其他面包括背面和/或侧面,所述其他二维坐标系包括:二维背视坐标系和/或二维侧视坐标系;根据所述第二映射关系,将所述第二样本激光点云数据和所述第二待调整标注框显示在与所述其他二维坐标系对应的其他二维界面中;获取标注员针对所述其他二维界面显示的第二待调整标注框输入的第三调整操作;根据所述第三调整操作对所述第二待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。4.如权利要求1所述的方法,其特征在于,当更新后的网络模型确定所述第二样本激光点云数据中不存在待标注对象时,所述方法还包括:将所述第二样本激光点云数据加入负样本训练集中;所述负样本训练集中的样本激光点云数据拒绝针对标注员进行显示。5.如权利要求1所述的方法,其特征在于,所述根据所述模型训练数据,对目标网络模型进行训练的步骤,包括:将所述模型训练数据中的样本激光点云数据输入目标网络模型中;所述目标网络模型包括特征提取层和回归层;通过所述特征提取层的第一模型参数,确定所述样本激光点云数据中的特征向量;通过所述回归层的第二模型参数,对所述特征向量进行回归,得到初始标注框;确定所述初始标注框与所述模型训练数据中样本激光点云数据对应的标准标注框之间的差异;当所述差异大于预设差异阈值时,根据所述差异修改所述第一模型参数和所述第二模型参数,返回执行所述将所述样本激光点云数据输入目标网络模型中的步骤;当所述差异不大于预设差异阈值时,确定所述目标网络模型训练完成。6.如权利要求1~5任一项所述的方法,其特征在于,当...

【专利技术属性】
技术研发人员:房思昊王奥丞张笑宇韩嘉杰袁彬白宇利
申请(专利权)人:初速度苏州科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1