【技术实现步骤摘要】
【国外来华专利技术】一种通过使用自适应超参数集的多阶段学习对自动驾驶汽车的机器学习网络进行设备上学习的方法及使用其的设备上学习装置
[0001]本专利技术要求于2020年5月5日提交的美国专利申请第63/020,101号和2021年4月13日提交的美国专利申请第17/229,350号的优先权和权益,其全部内容通过引用合并于此。
[0002]本专利技术涉及一种对自动驾驶汽车的机器学习网络进行设备上学习的方法和使用其的装置,更具体地,涉及一种通过在嵌入有(Embedded)安装在自动驾驶汽车中的机器学习网络的系统上使用自适应超参数集的多阶段学习进行设备上学习的方法及使用其的装置。
技术介绍
[0003]为了将应用于自动驾驶汽车的机器学习网络应用于现有未经学习的新驾驶环境,需要在自动驾驶汽车行驶时使用从传感器(例如,摄像头、激光雷达和雷达等)获取的信息重新学习所述机器学习网络的过程。
[0004]当使用从自动驾驶汽车获得的数据执行标注以生成用于学习的真实数据(ground truth)时,很难在自动驾驶汽车本身上执行此操作,从而提出了 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种通过使用自适应超参数集的多阶段学习对自动驾驶汽车的机器学习网络进行设备上学习的方法,所述方法包括:(a)当在自动驾驶汽车行驶过程中获取新的学习用数据的状态下满足设备上学习条件时,设备上学习装置(i)参考默认超参数集将当前学习分为第1阶段学习至第n阶段学习,通过使用所述新的学习用数据和先前学习中使用的先前学习用数据,生成用于所述第1阶段学习至所述第n阶段学习的第1阶段学习用数据至第n阶段学习用数据,其中所述n为2以上的整数,(ii)基于所述默认超参数集中包括的多个超参数中每一个的默认值组合预设范围内的每个第1候选值,生成第1超参数集候选至第(1_h)超参数集候选,其中所述h为2以上的整数,(iii)分别应用所述默认超参数集和所述第1超参数集候选至所述第(1_h)超参数集候选,分别使用所述第1阶段学习用数据以训练所述机器学习网络,(iv)评估每个通过分别应用所述默认超参数集和所述第1超参数集候选至所述第(1_h)超参数集候选来训练的所述机器学习网络的性能,选择性能最高的所述机器学习网络作为所述第1阶段学习的机器学习网络,(v)生成所述第1阶段学习的机器学习网络的训练中应用的超参数集作为第1自适应超参数集;(b)所述设备上学习装置将k从2增加到(n
‑
1),(i)基于第(k
‑
1)自适应超参数集中包括的多个超参数中每一个的第(k
‑
1)自适应值组合所述预设范围内的每个第k候选值,生成第(k_1)超参数集候选至第(k_h)超参数集候选,(ii)分别应用所述第(k
‑
1)超参数集和所述第(k_1)超参数集候选至所述第(k_h)超参数集候选,分别使用所述第k阶段学习用数据以训练第(k
‑
1)阶段学习的机器学习网络,(iii)评估每个通过分别应用所述第(k
‑
1)自适应超参数集和所述第(k_1)超参数集候选至所述第(k_h)超参数集候选来训练的所述第(k
‑
1)阶段学习的机器学习网络的性能,选择性能最高的所述第(k
‑
1)阶段学习的机器学习网络作为第k阶段学习的机器学习网络,(iv)生成所述第k阶段学习的机器学习网络的训练中应用的超参数集作为第k自适应超参数集;以及(c)所述设备上学习装置使用参考(i
‑
1)所述第1自适应超参数集至第(n
‑
1)自适应超参数集中每一个和(i
‑
2)所述第1阶段学习中训练的机器学习网络至第(n
‑
1)阶段学习中训练的机器学习网络各自的性能评估结果构建的优化函数来生成第n自适应超参数集,(ii)应用所述第n自适应超参数集,使用所述第n阶段学习用数据对所述第(n
‑
1)阶段学习的机器学习网络进行第n阶段学习,从而完成所述当前学习。2.根据权利要求1所述的方法,还包括:(d)所述设备上学习装置执行如下处理:(i)当所述当前学习完成后所述机器学习网络的性能没有提高到一定阈值以上时,不更新所述机器学习网络,使用所述机器学习网络运行所述自动驾驶汽车,直到满足下一次设备上学习条件;以及(ii)当所述当前学习完成后所述机器学习网络的性能提高一定阈值以上时,使用当前学习的机器学习网络更新所述机器学习网络,使用所述当前学习的机器学习网络运行所述自动驾驶汽车,直到满足所述下一次设备上学习条件。3.根据权利要求1所述的方法,所述设备上学习装置在所述第k阶段学习的机器学习网络的性能高于所述第(k
‑
1)阶段学习的机器学习网络的性能时,将第(k+1)自适应超参数集至所述第n自适应超参数集分别设置为等于所述第k自适应超参数集。
4.根据权利要求1所述的方法,在所述(b)步骤中,所述设备上学习装置将所述第1自适应超参数集至所述第n自适应超参数集所包括的至少一个超参数的自适应值保持相同。5.根据权利要求1所述的方法,所述设备上学习装置在所述第k阶段学习中训练的机器学习网络的性能高于所述第(k
‑
1)阶段学习中训练的机器学习网络的性能时,通过将所述第k阶段学习设置为所述第n阶段学习来完成所述当前学习。6.根据权利要求1所述的方法,在所述(a)步骤中,当获得由安装在所述自动驾驶汽车上的传感器获得的传感数据时,在所述机器学习网络分析所述传感数据以生成针对所述自动驾驶汽车的驾驶信息的输出数据的状态下,所述设备上学习装置将所述传感数据和与每个所述传感数据对应的输出数据输入至所述数据选择网络,使得所述数据选择网络参考所述输出数据选择用于所述机器学习网络的训练的特定传感数据,并将所选的特定传感数据存储为所述新的学习用数据。7.根据权利要求1所述的方法,所述超参数包括学习算法设置、小批大小、最大阶段和所述每个阶段的最大时期中的至少一个。8.根据权利要求1所述的方法,在所述(a)步骤中,所述设备上学习装置选择预先确定为所述机器学习网络的基础模型的超参数集作为所述默认...
【专利技术属性】
技术研发人员:诸泓模,金镕重,刘东奎,权成颜,
申请(专利权)人:斯特拉德视觉公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。