自动挖掘场景数据的模型更新方法、装置及存储介质制造方法及图纸

技术编号:34032663 阅读:50 留言:0更新日期:2022-07-06 11:31
本公开提供了自动挖掘场景数据的模型更新方法、装置及存储介质,涉及自动驾驶、深度学习以及大数据处理等人工智能领域,其中的方法可包括:针对每次获取到的待入库数据,分别对其进行特征数据抽取,并将所述特征数据存入数据库系统中;当确定符合预定的触发条件时,从数据库系统中获取本次触发对应的特征数据,并根据获取到的特征数据进行模型的训练和评估。应用本公开所述方案,可节省人力和时间成本,提升处理效率等。提升处理效率等。提升处理效率等。

Model updating method, device and storage medium for automatically mining scene data

【技术实现步骤摘要】
自动挖掘场景数据的模型更新方法、装置及存储介质


[0001]本公开涉及人工智能
,特别涉及自动驾驶、深度学习以及大数据处理等领域的自动挖掘场景数据的模型更新方法、装置及存储介质。

技术介绍

[0002]目前,在进行自动驾驶模型训练时,通过需要较多的人工操作,如人工标注数据,如针对需要的驾驶场景,人工标注出合理的驾驶行为轨迹,另外,还需要手动进行数据的抽取,即训练完成后根据评估效果再手动抽取所需的数据等,从而需要耗费较大的人力和时间成本,且效率低下。

技术实现思路

[0003]本公开提供了自动挖掘场景数据的模型更新方法、装置及存储介质。
[0004]一种自动挖掘场景数据的模型更新方法,包括:
[0005]针对每次获取到的待入库数据,分别对其进行特征数据抽取,并将所述特征数据存入数据库系统;
[0006]当确定符合预定的触发条件时,从所述数据库系统中获取本次触发对应的特征数据,并根据获取到的特征数据进行模型的训练和评估。
[0007]一种自动挖掘场景数据的模型更新装置,包括:数据处理模块以及模型更新模块;
[0008]所述数据处理模块,用于针对每次获取到的待入库数据,分别对其进行特征数据抽取,并将所述特征数据存入数据库系统;
[0009]所述模型更新模块,用于当确定符合预定的触发条件时,从所述数据库系统中获取本次触发对应的特征数据,并根据获取到的特征数据进行模型的训练和评估。
[0010]一种电子设备,包括:
[0011]至少一个处理器;以及
[0012]与所述至少一个处理器通信连接的存储器;其中,
[0013]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。
[0014]一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行如以上所述的方法。
[0015]一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如以上所述的方法。
[0016]上述公开中的一个实施例具有如下优点或有益效果:可实现自动化数据抽取、数据存储、模型训练及评估的一套完整的数据闭环处理方式,从而节省了人力和时间成本,并提升了处理效率,所述方式可适用于自动驾驶等场景,如先用一小部分测试数据训练确定好模型结构,之后通过数据闭环,自动抽取大规模线上真实的数据继续去训练完善模型,自动评估模型效果,最终自动调节出效果比较好的参数,从而实现自动驾驶中相似场景数据
挖掘等。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1为本公开所述自动挖掘场景数据的模型更新方法实施例的流程图;
[0020]图2为本公开所述自动挖掘场景数据的模型更新方法的整体实现过程示意图;
[0021]图3为本公开所述自动挖掘场景数据的模型更新装置实施例300的组成结构示意图;
[0022]图4示出了可以用来实施本公开的实施例的电子设备400的示意性框图。
具体实施方式
[0023]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0024]另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0025]图1为本公开所述自动挖掘场景数据的模型更新方法实施例的流程图。如图1所示,包括以下具体实现方式。
[0026]在步骤101中,针对每次获取到的待入库数据,分别对其进行特征数据抽取,并将所述特征数据存入数据库系统。
[0027]在步骤102中,当确定符合预定的触发条件时,从数据库系统中获取本次触发对应的特征数据,并根据获取到的特征数据进行模型的训练和评估。
[0028]可以看出,采用上述方法实施例所述方案,可实现自动化数据抽取、数据存储、模型训练及评估的一套完整的数据闭环处理方式,从而节省了人力和时间成本,并提升了处理效率等。
[0029]所述方案可适用于自动驾驶场景,如先用一小部分测试数据训练确定好模型结构,之后通过数据闭环,自动抽取大规模线上真实的数据继续去训练完善模型,并自动评估模型效果,最终自动调节出效果比较好的参数,从而实现自动驾驶中相似场景数据挖掘等。
[0030]在实际应用中,可采用天级的数据入库方式,即可将每天获取到的待入库数据(如车上回传的开环数据等)存入数据库系统。另外,待入库数据可能来自不同的数据源,不同的数据源可分别对应不同的入库程序作业类型,即不同的作业提交方式。比如,入库程序作业类型可包括:云仿真(Dreamland)自定义跑法作业、智能设备群组

机器操作系统(IDG

ROS,Intelligent Devices Group

Robot Operating System)作业、快速通用计算引擎(Spark)作业等。
[0031]另外,针对待入库数据,可对其进行特征数据抽取,如何进行特征数据抽取不作限
制。本公开的一个实施例中,可抽取出由简单字段数据和复杂字段数据组成的特征数据。
[0032]特征中的部分数据可以方便的存储为各类表格系统都支持的简单字段,对应于简单的数据类型,如整型(int)、字符串(string)、浮点型(float)、数组等,其它字段则较为复杂。复杂字段数据中可包括模型训练所需的各种数据,其中可包括标注结果等。
[0033]本公开的一个实施例中,还可对数据库系统中的数据进行可视化展示,和/或,支持对数据库系统中的数据进行即席(ad

hoc)查询,从而方便了用户对数据的查看和使用。如何进行可视化展示同样不作限制。
[0034]另外,本公开的一个实施例中,可将获取到的特征数据存入第一数据库系统,第一数据库系统可为数据仓库类系统,如云数据仓库(UDW,UCloud Data Warehouse)。
[0035]使用数据仓库类系统,可以很好的满足数据定时入库需求,并可支持海量数据的快速导入和导出,从而方便后续从第一数据库系统中导出模型训练所需的特征数据。
[0036]本公开所述方案中,还有对简单字段数据进行分析筛选的需求,而数据仓库类系统的数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动挖掘场景数据的模型更新方法,包括:针对每次获取到的待入库数据,分别对其进行特征数据抽取,并将所述特征数据存入数据库系统;当确定符合预定的触发条件时,从所述数据库系统中获取本次触发对应的特征数据,并根据获取到的特征数据进行模型的训练和评估。2.根据权利要求1所述的方法,其中,所述进行特征数据抽取包括:抽取出由简单字段数据和复杂字段数据组成的特征数据。3.根据权利要求2所述的方法,其中,所述将所述特征数据存入数据库系统包括:将所述特征数据存入第一数据库系统,所述第一数据库系统为数据仓库类系统。4.根据权利要求3所述的方法,其中,所述符合预定的触发条件包括:到达预定的时间点;所述从所述数据库系统中获取本次触发对应的特征数据包括:从所述第一数据库系统中获取全部的复杂字段数据,作为本次触发对应的特征数据。5.根据权利要求3所述的方法,还包括:从所述特征数据中提取出全部或符合预定要求的简单字段数据,将提取出的简单字段数据存入第二数据库系统,所述第二数据库系统为联机分析处理类系统;所述符合预定的触发条件包括:获取到用户的手动触发请求;所述从所述数据库系统中获取本次触发对应的特征数据包括:根据所述第二数据库系统中的简单字段数据,从所述第一数据库系统中的复杂字段数据中过滤出符合用户需求的复杂字段数据,将过滤出的复杂字段数据作为本次触发对应的特征数据。6.根据权利要求5所述的方法,其中,所述根据所述第二数据库系统中的简单字段数据,从所述第一数据库系统中的复杂字段数据中过滤出符合用户需求的复杂字段数据包括:通过对所述第二数据库系统中的简单字段数据进行分析筛选,生成符合所述用户需求的数据标识列表;从所述第一数据库系统中的复杂字段数据中过滤出所述数据标识列表中的数据标识对应的复杂字段数据。7.根据权利要求1~6中任一项所述的方法,其中,所述进行模型的训练包括:进行模型的全量训练,或者,进行模型的增量训练;和/或,所述进行模型的训练包括:采用集群训练方式进行模型的训练,或者,采用单机训练方式进行模型的训练。8.根据权利要求1~6中任一项所述的方法,还包括:对所述数据库系统中的数据进行可视化展示;和/或,支持对所述数据库系统中的数据进行即席查询。9.根据权利要求1~6中任一项所述的方法,其中,所述根据获取到的特征数据进行模型的训练和评估包括:根据获取到的特征数据进行模型的训练,对训练得到的模型进行指标评估。
10.一种自动挖掘场景数据的模型更新装置,包括:数据处理模块以及模型更新模块;所述数据处理模块,用于针对每次获取到的待入库数据,分别对其进行特征数据抽取,并将所述特征数据存入数据库系统;所述模型更新模块,用于当确定符合预定的触发条件时,从所述...

【专利技术属性】
技术研发人员:苟少帅
申请(专利权)人:阿波罗智能技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1