一种基于云端大模型的数据闭环方法技术

技术编号:35860710 阅读:15 留言:0更新日期:2022-12-07 10:50
本发明专利技术公开了一种基于云端大模型的数据闭环方法,一种基于云端大模型的数据闭环方法,在车端平台上采集车辆上的原始数据,比如传感器数据、车身或车底盘的信号、驾驶员的行为等;将采集到的车辆原始数据压缩后,在车联网的环境下,发送给云端平台,云端平台进行接收;当采集的车辆原始数据发送至云端平台后,云端平台针对不同的数据进行数据筛选;进行模型结果d iff,分析d iff结果,得到异常行为检测数据;筛选出有异常行为的数据,并将筛选后的数据输入到大模型中进行预训练,对数据进行简单的预标注;数据存储,提取d iff数据,将处理好的数据存储至云端平台中;数据处理,获取筛选后的数据反馈给相应的模型进行迭代训练。筛选后的数据反馈给相应的模型进行迭代训练。筛选后的数据反馈给相应的模型进行迭代训练。

【技术实现步骤摘要】
一种基于云端大模型的数据闭环方法


[0001]本专利技术涉及自动驾驶数据处理
,特别是涉及一种基于云端大模型的数据闭环方法。

技术介绍

[0002]随着自动驾驶科技水平的发展,对车辆数据采集要求越来越高。车辆数据采集是自动驾驶研发中重要的一环,采集的数据主要包括图像数据、激光雷达数据、毫米波雷达数据、超声波雷达数据和整车运动参数数据。这些数据将会作为数据输入样本,利用模型对这些数据进行训练。
[0003]在传统自动驾驶方案中,大多数公司针对采集到的数据主要是通过算法厂商统一提供的算法模型进行模型训练,而针对后期的算法优化等操作则需要由算法厂商统一进行升级处理。但这种方式会使得算法模型的识别精度差且识别错误率较高,另外迭代升级需要较长时间,升级后的算法模型对于一些异常情况以及难例识别的针对性效果较差。

技术实现思路

[0004]为了克服现有技术的不足,本专利技术提供一种基于云端大模型的数据闭环方法,将大模型部署在云端上,能够对采集到的车辆数据进行筛选,并将筛选的数据结果与当前车端模型的结果进行分析对比,得到异常行为检测数据,并对异常的数据进行预训练和预标注,识别精度高,从而减轻了后期模型的标注工作量,提高模型训练的效率,同时也能够对难例识别的情况进行模型标注,从而可以实现迭代优化,而将迭代后的模型上传至云端内,可以增加模型的识别正确率以及鲁棒性。
[0005]为解决上述技术问题,本专利技术提供如下技术方案:一种基于云端大模型的数据闭环方法,包括以下步骤:
[0006]S1、数据采集,在车端平台上采集车辆上的原始数据,比如传感器数据、车身或车底盘的信号、驾驶员的行为等,以及通过车端边缘计算获取车辆原始数据;
[0007]S2、数据上传,将采集到的车辆原始数据压缩后,在车联网的环境下,发送给云端平台,云端平台进行接收;
[0008]S3、数据筛选,当采集的车辆原始数据发送至云端平台后,云端平台针对不同的数据进行数据筛选;
[0009]S4、结果分析,进行模型结果diff,分析diff结果,云端平台将大模型预刷得到的数据结果与当前车端模型的结果进行分析对比,得到异常行为检测数据;
[0010]S5、数据预标,筛选出有异常行为的数据,并将筛选后的数据输入到大模型中进行预训练,对数据进行简单的预标注;
[0011]S6、数据存储,提取diff数据,将处理好的数据存储至云端平台中;
[0012]S7、数据处理,获取筛选后的数据反馈给相应的模型进行迭代训练;
[0013]S8、数据应用,将迭代后的模型应用上传至云端内,进而部署到车端平台,进行新
批次的验证和数据采集,从而提高车辆数据的采集精度和效率。
[0014]作为本专利技术的一种优选技术方案,在车端平台采集车辆的原始数据时,通过数据采集模块进行采集。
[0015]作为本专利技术的一种优选技术方案,在上传车辆原始数据时,云端平台通过云端数据接收模块接收所有的数据。
[0016]作为本专利技术的一种优选技术方案,在进行数据筛选时,云端平台通过大模型预刷模块针对不同的数据进行筛选。
[0017]作为本专利技术的一种优选技术方案,在进行数据预标时,通过大模型预标记模块对筛选后的车辆原始数据进行预训练和预标注。
[0018]作为本专利技术的一种优选技术方案,在进行数据存储时,云端平台中设置有存储模块,处理好的数据存储在存储模块内。
[0019]作为本专利技术的一种优选技术方案,在进行数据处理时,模型设置于优化模块内,筛选后的数据上传至优化模块内,通过优化模块内相应的模型进行迭代训练。
[0020]作为本专利技术的一种优选技术方案,所述数据闭环方法还包括:通过本地研发平台为云端平台提供算法模型,便于提高云端平台的训练能力;同时也为车端平台提供采集策略,使采集车辆原始数据的过程更加高效,有利于提高车辆性能。
[0021]与现有技术相比,本专利技术能达到的有益效果是:
[0022]本专利技术方案采用的数据闭环方法,将大模型部署在云端平台上,对获取的车辆原始数据进行初步筛选,而后进行数据diff,使得云端平台能够将大模型预刷得到的数据结果与当前车端模型的结果进行分析对比,得到异常行为检测数据,并对异常的数据进行预训练和预标注,识别精度高,从而减轻了后期模型的标注工作量,提高模型训练的效率,同时也能够对难例识别的情况进行模型标注,从而可以实现迭代优化,而将迭代后的模型上传至云端内,可以增加模型的识别正确率以及鲁棒性。
附图说明
[0023]图1为本专利技术方法示意图;
[0024]图2为本专利技术流程示意图;
[0025]图3为本专利技术模块示意图;
具体实施方式
[0026]为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施例,进一步阐述本专利技术,但下述实施例仅仅为本专利技术的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其它实施例,都属于本专利技术的保护范围。下述实施例中的实验方法,如无特殊说明,均为常规方法,下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0027]实施例一
[0028]本专利技术提供一种基于云端大模型的数据闭环方法,包括以下步骤:
[0029]S1、数据采集,在车端平台上采集车辆上的原始数据,比如传感器数据、车身或车底盘的信号、驾驶员的行为等,以及通过车端边缘计算获取车辆原始数据,在进行数据采集
时,数据采集通过数据采集模块实现;
[0030]S2、数据上传,将采集到的车辆原始数据压缩后,在车联网的环境下,发送给云端平台,云端平台进行接收,云端平台在接收数据时,接收数据通过云端数据接收模块实现;
[0031]S3、数据筛选,当采集的车辆原始数据发送至云端平台后,云端平台针对不同的数据进行数据筛选,在进行数据筛选时,云端平台通过大模型预标记模块实现筛选数据;
[0032]S4、结果分析,进行模型结果diff,分析diff结果,云端平台将大模型预刷得到的数据结果与当前车端模型的结果进行分析对比,得到异常行为检测数据;
[0033]S5、数据预标,筛选出有异常行为的数据,并将筛选后的数据输入到大模型中进行预训练,对数据进行简单的预标注,在进行数据预标时,通过大模型预标记模块实现预训练和预标注;
[0034]S6、数据存储,提取diff数据,将处理好的数据存储至云端平台中,在进行数据存储时,云端平台中设置有存储模块,处理好的数据存储在存储模块内;
[0035]S7、数据处理,获取筛选后的数据反馈给相应的模型进行迭代训练,模型设置于优化模块内,筛选后的数据上传至优化模块内,通过优化模块实现迭代训练;
[0036]S8、数据应用,将迭代后的模型应用上传至云端内,进而部署到车端平台,进行新批次的验证和数据采集,从而提高车辆数据的采集精度和效率;
[0037]在本专利技术的具体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于云端大模型的数据闭环方法,其特征在于:包括以下步骤:S1、数据采集,在车端平台上采集车辆上的原始数据,比如传感器数据、车身或车底盘的信号、驾驶员的行为等,以及通过车端边缘计算获取车辆原始数据;S2、数据上传,将采集到的车辆原始数据压缩后,在车联网的环境下,发送给云端平台,云端平台进行接收;S3、数据筛选,当采集的车辆原始数据发送至云端平台后,云端平台针对不同的数据进行数据筛选;S4、结果分析,进行模型结果diff,分析diff结果,云端平台将大模型预刷得到的数据结果与当前车端模型的结果进行分析对比,得到异常行为检测数据;S5、数据预标,筛选出有异常行为的数据,并将筛选后的数据输入到大模型中进行预训练,对数据进行简单的预标注;S6、数据存储,提取diff数据,将处理好的数据存储至云端平台中;S7、数据处理,获取筛选后的数据反馈给相应的模型进行迭代训练;S8、数据应用,将迭代后的模型应用上传至云端内,进而部署到车端平台。2.根据权利要求1所述的一种基于云端大模型的数据闭环方法,其特征在于:在车端平台采集车辆的原始数据时,通过数据采集模块进...

【专利技术属性】
技术研发人员:李鑫武徐佳音丁华杰赵佳佳谷俊
申请(专利权)人:上海寻序人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1