一种基于联邦学习的用户数据隐私保护方法及系统技术方案

技术编号：40014843 阅读：12 留言：0更新日期：2024-01-16 15:50

本发明专利技术的一种基于联邦学习的用户数据隐私保护方法和系统，先采集车机端数据，将车机端数据按照数据权属、敏感度、抵触程度分为三类，对于二类车机端数据和三类车机端数据，采用安全加密方式从车机端传递到云端或第三方监管端，云端可通过加密信道完全获取车机端采集到的原始数据信息；对于一类车机端数据，结合可信执行环境的本地化安全存储技术，只存储在车机端本地；车机端通过联邦学习计算框架利用已经存储的车机端模型，结合一类车机端数据进行模型训练，并向云端提交训练后的车机端模型；云端将其接收的训练后的车机端模型与云端模型进行聚合，云端对聚合后的模型进行大数据运算。该方法不需要共享整个原始数据集，避免了隐私泄露。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能网联汽车的座舱数据安全和隐私保护技术，具体为一种基于联邦学习的用户数据隐私保护方法及系统。

技术介绍

1、随着车联网、智能座舱技术的迅猛发展，智能汽车越发普及，智能座舱等智能网联设备向云端或边缘端设备发送的信息数据中可能涵盖了车主用户的身份隐私、驾驶行为信息、车辆位置信息、车辆行驶信息如车辆的车速、方向、转向数据，经常出入地点比如家或常用目的地poi(point of interest)信息以及用户操作行为等个人敏感信息。

2、同时，国家层面的数据隐私安全保护法规越来越清晰、严格，受限于用户隐私信息保护等合规问题，车机端敏感数据不能离车或加密离车的需求越来越高。前述各类信息/用户个人数据未来很可能被禁止/限制直接分享给汽车生产厂家或者第三方机构。

3、具体来讲就是，依照法律法规前述各个数据有明确的拥有者，如车辆用户、车辆生产企业、监管机构各自拥有部分数据。对于汽车生产厂家或者第三方机构而言，部分数据(特别是用户数据)属于法规中禁止离开/上传的本地数据，也是用于提升车主体验时不可或缺的数据。

4、现有解决数据安全性问题的方法通常包括：

5、1.通过加密和认证手段将采集到的原始数据直接进行加密传输。

6、该方式中，采集和传输用户数据还是用户原始数据集，并未真正将用户隐私数据保留在车机本地，数据在云端和传输过程中均有泄露或非法滥用的风险。

7、2.采用可信计算环境tee(trusted execution environment)对采集的隐私数据进行加密存储。

8、该方式一般是在云端后台进行脱敏和匿名化处理，但未真正在采集端对用户数据进行处理，未从采集源头上对用户隐私进行脱敏处理

9、上述现有方法，仅考虑到用户数据在联网传输过程中的泄露风险，未解决在保障用户隐私的情况下实现车辆信息共享，同时，满足汽车生产厂商运营或第三方监管机构需求，对用户的本地数据的充分及合理使用问题。

技术实现思路

1、本专利技术提供一种基于联邦学习的用户数据隐私保护方法和系统，通过联邦系统中加密机制下的参数交换方式，联合建立一个全局的共享模型，建好的模型在各自的区域只为本地的目标服务，达到数据不出本地的协同计算训练目的，并且高动态车辆只需将所训练的模型参数传送到云端或者路侧单元，不需要共享整个原始数据集，从而避免隐私泄露的风险。

2、本专利技术所述的一种基于联邦学习的用户数据隐私保护方法：

3、s1、先采集车机端数据，将车机端数据按照数据权属、敏感度、抵触程度分为三类：

4、一类车机端数据，是用户个人的敏感隐私数据,这类数据具有高度敏感属性，用户一般会强烈抵触分享；

5、二类车机端数据，是一般用户数据，用户敏感度较低，用户不抵触分享；

6、三类车机端数据，是车辆行驶数据；

7、s2、依据车机端数据所述种类，采用相应策略进行处理：

8、对于二类车机端数据和三类车机端数据，采用安全加密方式从车机端传递到云端或第三方监管端，云端可通过加密信道完全获取车机端采集到的原始数据信息；

9、对于一类车机端数据，结合可信执行环境的本地化安全存储技术，只存储在车机端本地；

10、车机端通过联邦学习计算框架利用已经存储的车机端模型，结合一类车机端数据进行模型训练，并向云端提交训练后的车机端模型；

11、云端将其接收的训练后的车机端模型与云端模型进行聚合，云端对聚合后的模型进行大数据运算。

12、本专利技术将车机端数据按照用户权限分成三类，对三类数据采用不同的处理策略，其中，用户个人的敏感隐私数据仅存储于车机端，在车机端进行车机端模型训练，车机端向云端提交训练后的车机端模型，云端对聚合后的模型进行大数据运算。该方法无须分享敏感原始数据，又能通过分享模型参数达到对隐私数据合理应用的目的。

13、相比目前直接上传用户原始数据进行后端模型计算或者后端数据隐私保护的方案，本方案从数据采集源头上就对数据进行脱敏保护，但同时又能达到端侧推荐模型计算与模型交换与更新的目的，最终完成用户场景智能推荐与用户隐私保护的双重目的。

14、优选的，所述一类车机端数据包括：车主用户人脸数据、指纹数据、声纹数据、车主年龄、车主性别、车主用户身份证号、车主手机好、车主联系人名单、车辆行驶轨迹、车辆位置信息等。

15、优选的，所述二类车机端数据包括：车辆颜色、车辆品牌、车辆vin码、车牌号等。

16、优选的，所述三类车机端数据包括：车辆行驶里程、车辆油耗、车辆电量消耗量、车速、转向角度、挡位信息、发动机工况数据、驱动电机工况数据、车辆远程诊断数据等。

17、优选的，所述车机端进行车机端模型训练时，初始的车机端模型是随机获得或根据同类任务的模型迁移获得。

18、优选的，对所述车机端模型的训练，包括：

19、s21、选择满足车辆注册状态条件的车辆作为模型训练车辆向云端进行车辆注册；

20、s22、云端根据预设任务选择初始的车机端模型及参数，并将初始的车机端模型及参数下发到模型训练车辆的车机端；

21、s23、模型训练车辆的车机端利用车机端数据(包含全部三类)对初始的车机端模型进行本地循环迭代训练，更新车机端模型及参数；

22、s24、车机端将训练后的车机端模型及参数经过加密后上传给云端；

23、s25、云端对车机端加密上传的车机端模型及参数，通过加权平均等方式聚合到云端模型中，得到新的云端模型及参数并更新云端原有的模型及参数；

24、s26、迭代执行步骤s24、s25，直到满足设定的迭代次数；

25、s27、云端根据更新后的云端模型及参数，对车机端的车机端模型及参数进行更新。

26、更优选的，s22中，云端根据预设任务还选择了车机端训练权重，并将车机端训练权重下发到模型训练车辆的车机端；

27、s23中，车机端依据车机端训练权重对初始的车机端模型进行本地循环迭代训练，更新车机端模型及参数；

28、更优选的，s22中，云端是根据预设任务及二类车机端数据，选择初始的车机端模型及参数

29、更优选的，所述二类车机端数据是车辆品牌和/或车辆型号。

30、更优选的，所述车辆注册状态条件包括：电或油量达到预设值、网络状态良好、处于泊车状态，达到这些车辆注册状态条件，可以减少模型训练异常中断情况。

31、更优选的，s26中，云端根据更新后的云端模型及参数，对车机端的车机端模型及参数进行更新；之后，

32、s27、迭代执行步骤s24、s25，直到满足设定的迭代次数。

33、将迭代次数的判断设置在最后一步，使得模型聚合是实时聚合方式，降低了模型训练中的等待时长，提升了数据共享效率；云端在收到模型训练车辆发来的车机端模型后，可以立刻进行聚合，并将本文档来自技高网...

【技术保护点】

1.一种基于联邦学习的用户数据隐私保护方法，其特征在于，包括：

2.如权利要求1所述的基于联邦学习的用户数据隐私保护方法，其特征在于，所述一类车机端数据包括：车主用户人脸数据、指纹数据、声纹数据、车主年龄、车主性别、车主用户身份证号、车主手机好、车主联系人名单、车辆行驶轨迹、车辆位置信息等。

3.如权利要求1所述的基于联邦学习的用户数据隐私保护方法，其特征在于，所述二类车机端数据包括：车辆颜色、车辆品牌、车辆VIN码、车牌号等。

4.如权利要求1所述的基于联邦学习的用户数据隐私保护方法，其特征在于，所述三类车机端数据包括：车辆行驶里程、车辆油耗、车辆电量消耗量、车速、转向角度、挡位信息、发动机工况数据、驱动电机工况数据、车辆远程诊断数据等。

5.如权利要求1所述的基于联邦学习的用户数据隐私保护方法，其特征在于，所述车机端进行车机端模型训练时，初始的车机端模型是随机获得或根据同类任务的模型迁移获得。

6.如权利要求1所述的基于联邦学习的用户数据隐私保护方法，其特征在于，对所述车机端模型的训练，包括：

7.如权利

8.如权利要求6所述的基于联邦学习的用户数据隐私保护方法，其特征在于，S22中，云端是根据预设任务及二类车机端数据，选择初始的车机端模型及参数。

9.如权利要求8所述的基于联邦学习的用户数据隐私保护方法，其特征在于，所述二类车机端数据是车辆品牌和/或车辆型号。

10.如权利要求6所述的基于联邦学习的用户数据隐私保护方法，其特征在于，所述车辆注册状态条件包括：电或油量达到预设值、网络状态良好、处于泊车状态，达到这些车辆注册状态条件，可以减少模型训练异常中断情况。

11.如权利要求6所述的基于联邦学习的用户数据隐私保护方法，其特征在于，S26中，云端根据更新后的云端模型及参数，对车机端的车机端模型及参数进行更新；之后，

12.一种基于联邦学习的用户数据隐私保护系统，其特征在于，包括：车机端、云端，车机端和云端双向数据连接，其中，

13.如权利要求12所述的基于联邦学习的用户数据隐私保护系统，其特征在于，所述车机端和云端设有身份认证模块，身份认证模块依据车辆注册状态条件判断是否启动模型参数训练。

14.如权利要求12所述的基于联邦学习的用户数据隐私保护系统，其特征在于，所述车机端设有初始的车机端模型，初始的车机端模型是从云端随机获得或根据同类任务的模型迁移获得。

15.如权利要求12所述的基于联邦学习的用户数据隐私保护系统，其特征在于，所述云端的模型训练模块是根据二类车机端数据向车机端分发初始的车机端模型。

16.如权利要求15所述的基于联邦学习的用户数据隐私保护系统，其特征在于，所述二类车机端数据是车辆品牌和/或车辆型号。

...

【技术特征摘要】

1.一种基于联邦学习的用户数据隐私保护方法，其特征在于，包括：

3.如权利要求1所述的基于联邦学习的用户数据隐私保护方法，其特征在于，所述二类车机端数据包括：车辆颜色、车辆品牌、车辆vin码、车牌号等。

6.如权利要求1所述的基于联邦学习的用户数据隐私保护方法，其特征在于，对所述车机端模型的训练，包括：

7.如权利要求6所述的基于联邦学习的用户数据隐私保护方法，其特征在于，s22中，云端根据预设任务还选择了车机端训练权重，并将车机端训练权重下发到模型训练车辆的车机端；

8.如权利要求6所述的基于联邦学习的用户数据隐私保护方法，其特征在于，s22中，云端是根据预设任务及二类车机端数据，选择初始的车机端模型...

【专利技术属性】
技术研发人员：徐科晋，
申请(专利权)人：摩斯智联科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人