一种信息安全保障模型训练方法和系统技术方案

技术编号:36985982 阅读:13 留言:0更新日期:2023-03-25 18:04
本公开涉及数据安全技术领域,提供了一种信息安全保障模型训练方法和系统,其中,模型训练方法包括:第一网关模块获取终端的发送的第一训练参数,第一网关模块利用网关特征样本对初始模型进行训练,得到第二训练参数,并将第一训练参数与第二训练参数进行聚合,将局部聚合训练参数上传至云端,第一网关模块接收云端下发的全局聚合模型参数,基于全局聚合模型参数对局部聚合训练参数进行更新,汇聚后的模型参数能够综合体现各个终端的对于敏感数据的定义,还可以体现出各个网关设备上可能存在敏感数据数据泄露的次敏感数据的信息,使得各个终端能够更为准确的检测哪些数据可能存在敏感信息的泄露。敏感信息的泄露。敏感信息的泄露。

【技术实现步骤摘要】
一种信息安全保障模型训练方法和系统


[0001]本公开涉及数据安全
,尤其涉及一种信息安全保障模型训练方法和系统。

技术介绍

[0002]智慧城市的建设模型主要由感知层、网络层、平台层和应用层4个层级构成。感知层主要侧重于信息的感知和监测,通过全面覆盖的感知网络透明、全面地获取各类信息;网络层由覆盖整个城市范围的互联网、通信网、广电网和物联网融合构成,实现各类信息的广泛、安全传递;平台层由各类应用支撑公共平台和数据中心构成,实现信息的有效、科学处理;应用层则涵盖智慧政务、智慧城管、智慧教育、智慧家居、智慧小区、智慧医疗、智慧园区、智慧商业等各个领域的综合、融合应用。这些应用与城市发展水平、生活质量、区域竞争力紧密相关,并推动城市可持续发展。
[0003]智慧城市以物联网、云计算、大数据、移动互联网等新一代信息技术来推动实体基础设施和信息基础设施相融合,通过信息化促进城市发展转型和管理方式的转变,在建设过程中,因其开放、互联、协同、创新的特征,每个环节都面临严峻的安全问题。
[0004]信息和数据是促进智慧城市发展的核心推动力,信息公开和共享成为了智慧城市发展的必要条件,然而大数据环境下隐私数据和公共数据模糊混杂在云端,难以界定,“公共数据开放”与“个人隐私保护”之间存在着一定的冲突,而相关技术中,对于敏感数据往往致力于感知层上传数据时对敏感数据脱敏处理,以及云计算中对于敏感数据的加密,然而,智慧城市中云计算、移动互联网、物联网、大数据等新一代信息与通信技术在智慧城市中的广泛应用,使智慧城市从孤立向全面的互联互通、数据共享以及物理世界发展,这些特性决定了智慧城市信息安全的重点将不再仅仅对传统的数据中心保护,而是涉及到多层次多范围的系统性工程,这给安全带来了新的挑战和新的风险点。如智慧城市中的感知层敏感数据的泄露,网络层的恶意行为攻击、云计算式引入了不可控的第三方,应用层的大数据分析同样加大了个人隐私信息泄露的风险等。
[0005]因此,对于敏感数据的威胁来自于智慧城市系统的方方面面,如何较为全面的保障敏感数据的安全成为亟待解决的技术问题。

技术实现思路

[0006]有鉴于此,本公开实施例提供了一种信息安全保障模型训练方法和系统,以解决现有技术中如何较为全面的保障敏感数据的安全的技术问题。
[0007]本公开实施例的第一方面,提供了一种信息安全保障模型训练方法,应用于信息安全保障系统,信息安全保障系统包括云端、第一网关模块和与第一网关模块通信的多个终端,训练方法适用于第一网关模块,训练方法包括:第一网关模块获取终端的发送的第一训练参数,第一训练参数为终端利用终端本地敏感数据样本对初始模型进行训练得到的敏感数据识别模型的模型参数,初始模型为终端、第一网关模块或云端中的任意一个建立;第
一网关模块利用网关特征样本对初始模型进行训练,得到第二训练参数,并将第一训练参数与第二训练参数进行聚合,得到局部聚合训练参数,并将局部聚合训练参数上传至云端,以在云端聚合得到全局聚合模型参数,其中,网关训练样本包括获取与终端本地敏感数据关联的次敏感数据的恶意网络行为特征样本;第一网关模块接收云端下发的全局聚合模型参数,基于全局聚合模型参数对局部聚合训练参数进行更新,得到局部聚合模型,并将全局聚合模型参数下发至终端,对第一训练参数进行更新。
[0008]可选地,第一网关模块利用网关特征样本对初始模型进行训练包括:基于网络行为分析确定各个网络行为获取的次敏感数据,次敏感数据为与终端敏感数据的关联度超过预设关联度,且数量超过预设数量的数据;基于大数据分析构建次敏感数据之间的非逻辑性关联;将指向终端的隐私信息的非逻辑性关联的次敏感数据和对应的网络行为作为网关特征样本对初始模型进行多轮次训练,得到初始局部聚合模型,初始局部聚合模型用于检测次敏感数据和后续通过第一网关模块的报文流是否具有恶意收集与终端本地敏感数据关联的次敏感数据的网络行为。
[0009]可选地,网关特征样本还包括其他第一网关模块共享的恶意行为特征样本。
[0010]可选地,网关特征样本还包括对终端本地敏感数据脱敏后得到脱敏数据样本。
[0011]可选地,第一网关模块还用于将局部聚合训练参数和/或更新后的局部聚合训练参数下发至终端,以使终端基于局部聚合训练参数和/或更新后的局部聚合训练参数对第一训练参数进行更新。
[0012]可选地,在终端内利用终端本地敏感数据样本对初始模型进行训练,得到训练后的敏感数据检测模型,敏感数据识别模型具有第一训练参数,并将第一训练参数上传至第一网关模块和云端;终端还用于接收全局聚合模型参数和/或局部聚合训练参数,并基于全局聚合模型参数和/或局部聚合训练参数对第一训练参数进行更新。
[0013]可选地,在终端内利用终端本地敏感数据样本对初始模型进行训练包括:对终端本体敏感数据进行敏感度度量,确定终端本体敏感数据的敏感度;基于敏感度选择本地敏感数据样本;利用选择的本地敏感数据样本对初始模型进行多轮次训练,得到敏感数据检测模型,敏感数据检测模型用于识别终端上传的数据中的敏感数据。
[0014]可选地,在云端聚合第一训练参数和局部聚合训练参数,得到全局聚合模型参数,将全局聚合模型参数分别下发至第一网关模块和终端,以分别对局部聚合训练参数和第一训练参数进行更新。
[0015]可选地,还包括:第二网关模块利用应用层的数据抓取行为特征样本对初始模型进行训练,得到第三训练参数,并将第三训练参数上传至云端,以使云端对聚合第一训练参数、局部聚合训练参数和第三训练参数,得到全局聚合模型参数,其中第二网关模块为应用层与云端之间的网关设备。
[0016]根据第二方面,本申请实施例还提供了一种信息安全保障系统,包括:云端、多个第一网关模块和与第一网关模块通信的多个终端,其中,云端具有利用上述第一方面任意一项模型训练方法得到的全局聚合模型,第一网关模块具有利用上述第一方面任意一项模型训练方法得到的局部聚合模型,终端具有利用上述第一方面任意一项模型训练方法得到的敏感数据检测模型。
[0017]本公开实施例与现有技术相比存在的有益效果是:云端连接有第一网关模块可以
包括多个网关设备,每一网关设备可以连接有多个终端,通过云端下发的初始模型,在各个终端以终端本体敏感数据样本进行训练,得到敏感数据检测模型,在各个网关设备以获取与终端本地敏感数据关联的次敏感数据的恶意网络行为特征样本进行训练,得到第二训练参数,并将第一训练参数进行聚合,再将聚合后的第一训练参数与第二训练参数进行二次聚合,之后在云端进行聚合得到全局聚合参数,并利用全局聚合参数分别对网关设备中的模型参数和终端中的模型参数进行更新,以使网关设备能够识别恶意网络行为,有助于终端设备不仅仅能够基于本地的敏感度定义识别敏感数据,还可以基于其他终端对敏感度定义识别敏感数据,以及还可以从网络攻击一方角度识别可能产生敏感数据泄露的次敏感数据,从而使得从终端至网关设备能够得出为防止敏感数据泄露对策。从而实现全面的保护敏感数据,使得不因终端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息安全保障模型训练方法,其特征在于,应用于信息安全保障系统,所述信息安全保障系统包括云端、第一网关模块和与所述第一网关模块通信的多个终端,所述训练方法适用于所述第一网关模块,所述训练方法包括:所述第一网关模块获取终端的发送的第一训练参数,所述第一训练参数为所述终端利用终端本地敏感数据样本对初始模型进行训练得到的敏感数据识别模型的模型参数,所述初始模型为所述终端、所述第一网关模块或所述云端中的任意一个建立;所述第一网关模块利用网关特征样本对所述初始模型进行训练,得到第二训练参数,并将所述第一训练参数与所述第二训练参数进行聚合,得到局部聚合训练参数,并将局部聚合训练参数上传至云端,以在所述云端聚合得到全局聚合模型的全局聚合模型参数,其中,所述网关训练样本包括获取与终端本地敏感数据关联的次敏感数据的恶意网络行为特征样本;所述第一网关模块接收所述云端下发的所述全局聚合模型参数,基于所述全局聚合模型参数对所述局部聚合训练参数进行更新,得到所述局部聚合模型,并将全局聚合模型参数下发至所述终端,对所述第一训练参数进行更新。2.如权利要求1所述的信息安全保障模型训练方法,其特征在于,所述第一网关模块利用网关特征样本对所述初始模型进行训练包括:基于网络行为分析确定各个网络行为获取的次敏感数据,所述次敏感数据为与终端敏感数据的关联度超过预设关联度,且数量超过预设数量的数据;基于大数据分析构建所述次敏感数据之间的非逻辑性关联;将指向终端的隐私信息的非逻辑性关联的次敏感数据和对应的网络行为作为网关特征样本对所述初始模型进行多轮次训练,得到初始局部聚合模型,所述初始局部聚合模型用于检测次敏感数据和后续通过所述第一网关模块的报文流是否具有恶意收集与终端本地敏感数据关联的次敏感数据的网络行为。3.如权利要求2所述的信息安全保障模型训练方法,其特征在于,所述网关特征样本还包括其他第一网关模块共享的恶意行为特征样本。4.如权利要求2或3所述的信息安全保障模型训练方法,其特征在于,所述网关特征样本还包括对终端本地敏感数据脱敏后得到脱敏数据样本。5.如权利要求1所述的信息安全保障模型训练方法,其特征在于,所述第一网关模块还用于将局部聚合训练参数和/或更新后的局部聚合训练...

【专利技术属性】
技术研发人员:严可达徐成蔡志飞许大为梁婵
申请(专利权)人:光谷技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1