一种基于隐私数据保护的智能网联汽车数据训练方法、电子设备及计算机可读存储介质技术

技术编号:34143131 阅读:13 留言:0更新日期:2022-07-14 18:18
本发明专利技术公开了一种基于隐私数据保护的智能网联汽车数据训练方法,先对历史采集的路试数据进行标注,然后进行模型训练,得到初版模型,将初版模型的低层特征提取层部署至车端;在车端,针对车端采集的原始数据,一方面通过部署的低层特征提取层进行特征提取,得到低层次特征数据集并上传到云端;另一方面,对原始数据进行匿名化处理并上传到云端进行数据标注;在云端,利用上传的数据集和历史数据集对除低层特征提取层外的其他特征提取层进行训练并更新;并将更新后的模型推送给车端进行同步更新。本发明专利技术在保证数据隐私传递的同时,解决了匿名化数据导致算法性能降低的问题,并在此基础上构造出算法闭环,解决模型迭代更新的问题。问题。问题。

【技术实现步骤摘要】
一种基于隐私数据保护的智能网联汽车数据训练方法、电子设备及计算机可读存储介质


[0001]本专利技术涉及智能网联汽车数据处理技术改进,具体涉及一种基于隐私数据保护的智能网联汽车数据训练方法,属于数据处理训练


技术介绍

[0002]随着自动驾驶技术在国内的蓬勃发展,各大主机厂商和技术供应商都在努力提升竞争力,提出了各种数据采集和算法训练的方法。例如:(1)浙江吉利控股集团有限公司的CN202210057268数据采集方法、装置、设备及存储介质,提出如下技术:在车辆行驶的过程中,获取车端传感器采集的车端数据以及路端传感器采集的路端数据,对车端数据和路端数据进行时空同步,并根据高精地图对时空同步后的车端数据和路端数据进行融合,得到目标数据,基于目标数据进行场景分类,获得多个场景对应的场景数据,根据场景数据构建自动驾驶场景库。(2)浙江零跑科技有限公司的CN201910454082 L3级自动驾驶系统道路驾驶数据采集、分析及上传方法,提出了如下技术:采集车端驾驶数据,包括驾驶数据的采集与同步及驾驶数据的编码与缓存,对采集到的车端驾驶数据进行在线数据分析,包括自动驾驶系统中间结果输出接口定义、目标匹配一致性检测、定位路标语义输出、极端车辆操作检测及人机决策一致性检测,然后进行数据通信,对车端驾驶数据做好上传准备,最后服务器端接收并存储车端驾驶数据。
[0003]因此,越来越多的数据被采集和用于算法训练,以提升自动驾驶的性能,但存在着用户关键信息被泄露的问题。为了保护用户关键信息不被恶意使用,相关部门规定汽车在收集车外的视频、图像数据时,不能直接将未经处理的数据向车外提供,如需向车外提供,则需要在车内对数据中的人脸、车牌信息等进行匿名化处理。因此,如何在保护用户隐私安全的前提下,智能网联汽车合理高效的采集和使用数据成为了一个关键挑战。
[0004]现有技术主要是在车端进行数据的匿名化处理,然后上传至云端,在云端利用匿名化后的数据进行模型的训练。这类技术的一个严重缺点是:原始数据经过匿名化后会丢失一些重要的信息,导致训练得到的算法模型在对非匿名化数据进行预测时存在偏见,会产生较大的误差,从而影响到算法的准确性。量产车实际上路后,会降低利用原始数据进行自动驾驶相关功能时的算法性能。
[0005]另外,量产后的网联汽车,其自动驾驶数据的采集、训练和部署未形成算法闭环,降低算法训练和模型迭代的速度。

技术实现思路

[0006]针对现有技术存在的上述不足,本专利技术的目的是提供一种基于隐私数据保护的智能网联汽车数据训练方法,本专利技术在保证数据隐私传递的同时,解决了匿名化数据导致算法性能降低的问题,并在此基础上构造出算法闭环,解决模型迭代更新的问题。
[0007]本专利技术的技术方案是这样实现的:
一种基于隐私数据保护的智能网联汽车数据训练方法,包括如下步骤,1)初版模型获取;在云端,先对历史采集的路试数据进行标注,然后进行模型训练,得到初版模型,将初版模型的低层特征提取层(如前两层的卷积层)部署至车端;2)车端原始数据特征提取;在车端,针对车端实时或历史采集的原始数据,通过步骤1)部署的低层特征提取层进行特征提取,得到原始数据的低层次特征数据集并上传到云端;3)车端数据脱敏处理;在车端对原始数据中的关键信息进行匿名化处理,得到匿名化数据后上传到云端并进行数据标注,得到标注结果数据集;4)云端模型更新数据准备;将步骤3)标注结果数据集中的数据与步骤2)低层次特征数据集中的数据进行一一对应,从而形成模型更新数据集;5)模型优化;在云端,利用步骤4)得到的模型更新数据集,对初版模型中除低层特征提取层外的其他特征提取层进行训练并更新;低层特征提取层与更新后的其他特征提取层一起作为优化后的模型,并将优化后的模型推送给车端进行同步更新。
[0008]进一步地,在步骤4)中,在云端,路试数据通过初版模型中与部署至车端的低层特征提取层相同的低层特征提取层进行特征提取,得到路试数据的低层次特征数据集,取路试数据的低层次特征数据集与上传到云端的原始数据的低层次特征数据两部分数据的并集,一起作为步骤4)的低层次特征数据集。
[0009]优选地,步骤1)的模型训练采用的模型为深度神经网络。
[0010]进一步地,所述深度神经网络包含但不限于卷积神经网络、循环神经网络及其相关变种等,所支持的算法包括但不限于目标检测算法、车道线识别算法、语义分割算法等。
[0011]在步骤3)中,原始数据的关键信息包括但不限于人脸和车牌,匿名化处理包括打马赛克、纯色填充、模糊处理。
[0012]本专利技术步骤2)中特征提取所用方法包含但不限于卷积、池化、切片。
[0013]步骤1)中部署至车端的低层特征提取层有多种层数,每次部署时,将不同层数的低层特征提取层同时部署在车端;步骤5)在云端训练并更新多个与车端低层特征提取层对应的其他特征提取层,由此得到多个优化后的模型,将性能最佳的一个模型同步给车端。
[0014]步骤4)中用于算法迭代更新的模型更新数据集包括但不限于路试数据集、车端采集的原始数据集,其它利用数据增强而得到数据集也包含在内,包括但不限于对低层次特征集进行翻转、旋转、缩放操作而生成的数据。
[0015]本专利技术还提供了一种基于隐私数据保护的智能网联汽车数据训练电子设备,包括存储器,配置为存储可执行指令;处理器,配置为执行存储器中存储的可执行指令,以实现前述的一种基于隐私数据保护的智能网联汽车数据训练方法。
[0016]本专利技术还同时提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令执行前述的一种基于隐私数据保护的智能网联汽车数据训练方法。
[0017]与现有技术相比,本专利技术具有如下有益效果:1、本专利技术通过在车端增加特征提取操作和匿名化处理,对用户关键信息进行处理,能够保护用户隐私安全,关键信息不泄露,不上传,符合监管要求。
[0018]2、本专利技术能较大程度保留原始数据的信息,相较于依靠纯匿名化数据进行模型训
练会丢失大量有用信息的短板,本专利技术能有效提升算法的训练效果。
[0019]3、本专利技术能实现智能网联汽车的数据采集、标注、训练闭环,能够在量产后持续提升自动驾驶算法的性能,而不需要花费较大车端路采和算法更新成本。
附图说明
[0020]图1为本专利技术基于隐私数据保护的智能网联汽车数据训练方法的逻辑架构图。
具体实施方式
[0021]以下结合附图和具体实施方式对本专利技术做进一步详细描述。
[0022]本专利技术提出了一种基于隐私数据保护的网联汽车数据采集、训练和迭代方法,如图1所示,分为三个部分:(1)量产前云端算法开发;(2)量产数据采集预处理;(3)算法迭代更新。通过此三部分,一方面可以保护用户隐私数据安全,充分利用原始数据和匿名化数据的信息来提升算法性能,另一方面能形成算法闭环,提高模型迭代更新的能力。以下分别对三部分进行详细说明。
[0023]在量产前云端算法开发阶段(即初版模型获取)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐私数据保护的智能网联汽车数据训练方法,其特征在于:包括如下步骤,1)初版模型获取;在云端,先对历史采集的路试数据进行标注,然后进行模型训练,得到初版模型,将初版模型的低层特征提取层部署至车端;2)车端原始数据特征提取;在车端,针对车端实时或历史采集的原始数据,通过步骤1)部署的低层特征提取层进行特征提取,得到原始数据的低层次特征数据集并上传到云端;3)车端数据脱敏处理;在车端对原始数据中的关键信息进行匿名化处理,得到匿名化数据后上传到云端并进行数据标注,得到标注结果数据集;4)云端模型更新数据准备;将步骤3)标注结果数据集中的数据与步骤2)低层次特征数据集中的数据进行一一对应,从而形成模型更新数据集;5)模型优化;在云端,利用步骤4)得到的模型更新数据集,对初版模型中除低层特征提取层外的其他特征提取层进行训练并更新;低层特征提取层与更新后的其他特征提取层一起作为优化后的模型,并将优化后的模型推送给车端进行同步更新。2.根据权利要求1所述的一种基于隐私数据保护的智能网联汽车数据训练方法,其特征在于:步骤4)中,在云端,路试数据通过初版模型中与部署至车端的低层特征提取层相同的低层特征提取层进行特征提取,得到路试数据的低层次特征数据集,取路试数据的低层次特征数据集与上传到云端的原始数据的低层次特征数据两部分数据的并集,一起作为步骤4)的低层次特征数据集。3.根据权利要求1所述的一种基于隐私数据保护的智能网联汽车数据训练方法,其特征在于:步骤1)的模型训练采用的模型为深度神经网络;所述深度神经网络包含但不限于卷积神经网络、循环神经网络及其相关变种,所支持的算法包括但不限于目标检测算法、车道线识别算法、语义分割算法。4.根据权利要求1所...

【专利技术属性】
技术研发人员:郝金隆唐照翔
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1