用于采集数据的方法、设备、介质和程序产品技术

技术编号:37878124 阅读:14 留言:0更新日期:2023-06-15 21:06
根据本公开的示例实施例,提供了用于采集数据的方法、设备、介质和程序产品。在该方法中,从交通工具的输入设备接收数据。从交通工具上所存储的数据库获取参考数据,参考数据与交通工具上所部署的用于辅助驾驶的模型相关联。响应于数据与参考数据之间的相似性高于阈值,将数据添加到用于训练模型的训练集。根据该方案,可以针对性地采集与参考数据相似的数据来训练用于辅助驾驶的模型,从而提高数据采集的效率。集的效率。集的效率。

【技术实现步骤摘要】
用于采集数据的方法、设备、介质和程序产品


[0001]本公开的实施例总体上涉及计算机领域,并且更具体地涉及用于采集数据的方法、设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]目前,越来越多的车辆部署机器学习模型来辅助用户驾驶车辆以提升用户体验。通常,这些机器学习模型可以利用车辆所采集的数据来训练和更新。例如,可以利用部署在车辆上的诸如摄像头、麦克风、激光雷达之类的传感器来采集各种数据,以作为训练模型的训练数据。然而,考虑到网络带宽和计算资源的限制,采集由传感器实时接收到的所有数据以作为训练数据是不现实的。因此,需要一种采集数据的方案以高效地采集对于模型训练有价值的数据。

技术实现思路

[0003]根据本公开的示例实施例,提供了一种用于采集数据的方案,以高效地采集与参考数据相似的、对于模型训练有价值的数据。
[0004]在本公开的第一方面,提供了一种用于采集数据的方法。该方法包括从交通工具的输入设备接收数据;从交通工具上所存储的数据库获取参考数据,参考数据与交通工具上所部署的用于辅助驾驶的模型相关联;响应于数据与参考数据之间的相似性高于阈值,将数据添加到用于训练模型的训练集。
[0005]在一些实施例中,方法还包括:基于数据和参考数据,利用交通工具上所部署的比较模型来确定相似性,比较模型基于与参考数据相关联的训练集被训练。
[0006]在一些实施例中,利用交通工具上所部署的比较模型来确定相似性包括:基于数据,利用比较模型确定表征数据的特征向量;基于参考数据,利用比较模型确定表征参考数据的参考特征向量;以及基于特征向量和参考特征向量,利用比较模型确定相似性。
[0007]在一些实施例中,方法还包括:基于数据,利用模型的至少一部分或交通工具上所部署的第一模型来确定表征数据的特征向量,第一模型不同于模型的至少一部分。
[0008]在一些实施例中,方法还包括:基于参考数据,利用以下一项来确定表征参考数据的参考特征向量:模型的至少一部分、第一模型、或交通工具上所部署的第二模型,第二模型不同于模型的至少一部分和第一模型。
[0009]在一些实施例中,方法还包括:基于向量空间中特征向量与参考特征向量之间的距离,确定数据与参考数据之间的相似性。
[0010]在一些实施例中,方法还包括:基于特征向量和参考特征向量,利用交通工具上所部署的第三模型来确定相似性,第三模型基于与参考特征向量相关联的训练集被训练。
[0011]在一些实施例中,获取参考数据包括:基于模型的功能和模型针对多个类型的数据的性能表现中的至少一项确定参考数据的类型;以及从数据库中的多个类型的参考数据中选择类型的参考数据。
[0012]在本公开的第二方面,提供了一种电子设备。该电子设备包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令在由至少一个处理单元执行时使设备执行动作。动作包括:从交通工具的输入设备接收数据;从交通工具上所存储的数据库获取参考数据,参考数据与交通工具上所部署的用于辅助驾驶的模型相关联;响应于数据与参考数据之间的相似性高于阈值,将数据添加到用于训练模型的训练集。
[0013]在本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序在由设备执行时使得设备执行根据本公开的第一方面的方法。
[0014]根据本公开的第四方面,提供了一种计算机程序产品。计算机程序产品包括计算机程序,计算机程序在被处理器执行时实现第一方面的方法。
[0015]应当理解,本
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。
附图说明
[0016]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
[0017]图1示出了根据本公开的实施例的示例环境的示意图;
[0018]图2示出了根据本公开的一些实施例的用于采集数据的过程的流程图;
[0019]图3示出了根据本公开的一些实施例的确定相似性的过程的示例;
[0020]图4示出了根据本公开的一些实施例的确定相似性的另一过程的示例;以及
[0021]图5示出了能够实施本公开的多个实施例的电子设备的框图。
具体实施方式
[0022]下面将参照附图更详细地描述本公开的实施例。虽然附图中示出了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0023]在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“一些实施例”应当理解为“至少一些实施例”。下文还可能包括其他明确的和隐含的定义。
[0024]如上文提及的,需要一种采集数据的方案以高效地采集对于模型训练有价值的数据。目前,考虑到网络和计算资源的限制,应用于车辆的数据采集方案通常利用随机采集的方式来采集由传感器接收的数据,例如每隔一段时间采集一次数据,从而减少采集过程对资源的消耗。然而,利用这种方式,所采集到数据是完全随机的。因此还需要人工筛选和标注对训练模型有价值的数据。
[0025]还有一些方案基于模型的性能表现来采集数据。通过观察模型针对由传感器接收的不同数据的性能表现,可以获悉针对哪些数据模型的性能表现较差。基于此,可以采集这
些数据以作为训练数据来更新模型,从而提高模型针对此类数据的性能表现。
[0026]例如,如果观察到模型对于所接收的包含信号灯的图片的识别准确性较低,可以将这些包含信号灯的图片采集为训练数据以用于进一步训练模型,也即更新模型。
[0027]然而,针对其模型具有较差的性能表现的数据未必是对训练模型有价值的数据。例如,对于用来识别图片中的信号灯的模型而言,模型对于包含行人而不是信号灯的图片的识别效果将会较差,但是利用这些包含行人的图片作为训练数据并不能提高模型识别信号灯的能力。因此,这种数据采集方案不能准确地采集对于模型训练有价值的数据。
[0028]根据本公开的实施例,提出了一种采集数据的方案。在该方案中,从交通工具的输入设备接收数据。从交通工具上所存储的数据库获取参考数据,参考数据与交通工具上所部署的用于辅助驾驶的模型相关联。响应于数据与参考数据之间的相似性高于阈值,将数据添加到用于训练模型的训练集。根据该方案,可以针对性地采集与参考数据相似的数据来训练用于辅助驾驶的模型,从而提高数据采集的效率。
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种采集数据的方法,包括:从交通工具的输入设备接收数据;从所述交通工具上所存储的数据库获取参考数据,所述参考数据与所述交通工具上所部署的用于辅助驾驶的模型相关联;以及响应于所述数据与所述参考数据之间的相似性高于阈值,将所述数据添加到用于训练所述模型的训练集。2.根据权利要求1所述的方法,还包括:基于所述数据和所述参考数据,利用所述交通工具上所部署的比较模型来确定所述相似性,所述比较模型基于与所述参考数据相关联的训练集被训练。3.根据权利要求2所述的方法,其中利用所述交通工具上所部署的比较模型来确定所述相似性包括:基于所述数据,利用所述比较模型确定表征所述数据的特征向量;基于所述参考数据,利用所述比较模型确定表征所述参考数据的参考特征向量;以及基于所述特征向量和所述参考特征向量,利用所述比较模型确定所述相似性。4.根据权利要求1所述的方法,还包括:基于所述数据,利用所述模型的至少一部分或所述交通工具上所部署的第一模型来确定表征所述数据的特征向量,所述第一模型不同于所述模型的至少一部分。5.根据权利要求4所述的方法,还包括:基于所述参考数据,利用以下一项来确定表征所述参考数据的参考特征向量:所述模型的至少一部分、所述第一模型、或所述交通工具上所部署的第二模型,所述第二模型不同于所述模型的至少一部分和所述第一模型。6.根据权利要求5所述的方法,还包括:基于向量空间中所述特征向量与所述参考特征向量之间的距离,确定所述数据与所述参考数据之间的所述相似性。7.根据权利要求5所述的方法,还包括:基于所述特征向量和所述参考特征向量,利用所述交通工具上所部署的第三模型来确定所述相似性,所述第三模型基于与所述参考特征向量相关联的训练集被训练。8.根据权利要求1所述的方法,其中获取所述参考数据包括:基于所述模型的功能和所述模型针对多个类型的数据的性能表现中的至少一项确定所述参考数据的类型;以及从所述数据库中的多个类型的参考数据中选择所述类型的参考数据。9.一种电子设备,包括:至少一个处理单元;以及至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令在由所述至少一个处理单元执行时使所述设备执行动作,所述动作包括:从交通工具的输入设备接收数据;从...

【专利技术属性】
技术研发人员:姚人杰段宁张超张行剑
申请(专利权)人:逸驾智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1