基于联邦学习的流量识别方法及装置制造方法及图纸

技术编号:26425689 阅读:19 留言:0更新日期:2020-11-20 14:23
本发明专利技术提供了一种基于联邦学习的流量识别方法及装置,可用于信息安全与大数据技术领域。方法包括:根据流量输入数据的协议标识,确定流量输入数据的协议类型;根据流量输入数据的协议类型,将流量输入数据的数据特征输入至对应的流量识别模型中,得到输出结果;其中,流量识别模型为利用横向联邦学习构建的;协议类型与流量识别模型对应;根据输出结果,确定属于攻击流量的流量输入数据。本发明专利技术通过利用基于联邦学习构建的识别模型进行流量检测识别,保证了数据隐私安全,增强了识别能力,实现了在确保正常流量数据的安全通信的同时,精确阻断流量数据中的隐蔽攻击,保障企业业务的安全、高效的运转。

【技术实现步骤摘要】
基于联邦学习的流量识别方法及装置
本专利技术涉及信息安全与大数据
,尤指一种基于联邦学习的流量识别方法及装置。
技术介绍
随着互联网及各类应用的快速发展规模的壮大,网络流量数据日益庞大。其中,以实施恶意攻击为目的的加密流量在网络传输中的比重越来越大,这给流量的检测识别带来了巨大的挑战。企业因为行业性质的差异,拥有不同属性的流量,由于企业间顾虑数据隐私泄露的风险,导致不同属性的流量没有有效的发挥它们的价值。传统商业领域的企业缺乏攻击流量支撑,难以对隐蔽攻击行为实时精准识别:传统商业领域的企业,比如:金融企业、零售企业、电子商务企业等,拥有数量庞大的客户、资金、征信等各类正常业务类型的流量样本,但是缺乏隐藏在加密流量中的攻击黑样本,使得传统商业领域的企业很难简单的依赖分析业务类型的加密流量样本对隐蔽的攻击流量进行识别,难以进行防护判别,可能造成企业的财产损失。专业的技术企业缺乏业务流量支撑,难以对客户的正常业务精准识别保护:专业的技术性企业,如信息安全公司,可能掌握大量的流量黑样本,但是缺乏正常的业务流量,因此难以分辨流量是否是客户的正常往来数据,在实施流量检测识别时,可能导致大量的正常业务流量数据被封禁,导致客户的资产损失。基于对数据安全的隐私保护、防止用户信息的泄露以及相关法律法规的要求,传统商业领域企业的正常业务类型的流量和专业技术企业获取的黑样本攻击流量数据无法直接共享、分析建模,难以实现数据资源的综合利用更精确的识别攻击流量。
技术实现思路
本专利技术实施例的主要目的在于提供一种基于联邦学习的流量识别方法及装置,在满足数据隐私保护和监管要求下,提升流量中隐蔽攻击的检测识别和防御能力。为了实现上述目的,本专利技术实施例提供一种基于联邦学习的流量识别方法,所述方法包括:根据流量输入数据的协议标识,确定所述流量样本数据的协议类型;根据流量输入数据的协议类型,将流量输入数据的数据特征输入至对应的流量识别模型中,得到输出结果;其中,所述流量识别模型为利用横向联邦学习构建的;所述协议类型与所述流量识别模型对应;根据所述流量识别模型的输出结果,确定属于攻击流量的流量输入数据。可选的,在本专利技术一实施例中,所述流量识别模型通过如下方式构建:从流量样本数据中提取相关数据特征,所述相关数据特征包括与所述协议类型对应的协议特征;将所述相关数据特征作为训练数据,输入至从联邦学习协作平台上获取的初始模型中,得到联邦学习模型及其中间参数;对所述中间参数进行加密,并将加密后的中间参数发送至联邦学习协作平台;接收所述联邦学习协作平台返回的更新后的中间参数,利用更新后的中间参数对所述联邦学习模型进行更新;将更新后的所述联邦学习模型对应的中间参数上传至所述联邦学习协作平台进行聚合,直至所述联邦学习模型收敛,所述联邦学习协作平台返回最终参数;利用所述最终参数对联邦学习模型进行更新,得到流量识别模型。可选的,在本专利技术一实施例中,所述中间参数包括样本数量、损失函数及梯度;所述样本数量及所述损失函数用于所述联邦学习协作平台确定表征联邦学习模型收敛程度的总损失函数,所述梯度用于所述联邦学习协作平台确定用以更新联邦学习模型的总梯度。可选的,在本专利技术一实施例中,所述接收所述联邦学习协作平台返回的更新后的中间参数,利用更新后的中间参数对所述联邦学习模型进行更新包括:接收所述联邦学习协作平台返回的总梯度;其中,所述联邦学习协作平台用于根据所述损失函数确定梯度计算权重,利用所述梯度计算权重及所述梯度确定总梯度;利用更新后的总梯度对所述联邦学习模型进行更新。可选的,在本专利技术一实施例中,所述将更新后的所述联邦学习模型对应的中间参数上传至所述联邦学习协作平台再次进行更新,直至所述联邦学习模型收敛,所述联邦学习协作平台返回最终参数包括:将更新后的所述联邦学习模型对应的样本数量、损失函数及梯度上传至所述联邦学习协作平台再次进行更新,直至所述联邦学习模型收敛,所述联邦学习协作平台返回最终参数;其中,所述联邦学习协作平台还用于根据所述样本数量确定权重汇总结果,利用所述权重汇总结果及所述损失函数计算总损失函数,并在所述总损失函数小于预设阈值时,判定所述联邦学习模型收敛。可选的,在本专利技术一实施例中,所述根据所述流量识别模型的输出结果,确定属于攻击流量的流量输入数据包括:根据所述流量识别模型的输出结果,判断所述流量输入数据是否为攻击流量,若是,则对攻击流量对应的账户进行封禁。本专利技术实施例还提供一种基于联邦学习的流量识别装置,所述装置包括:类型确定模块,用于根据流量输入数据的协议标识,确定所述流量输入数据的协议类型;模型识别模块,用于根据流量输入数据的协议类型,将流量输入数据的数据特征输入至对应的流量识别模型中,得到输出结果;其中,所述流量识别模型为利用横向联邦学习构建的;所述协议类型与所述流量识别模型对应;流量识别模块,用于根据所述流量识别模型的输出结果,确定属于攻击流量的流量输入数据。可选的,在本专利技术一实施例中,所述装置还包括模型构建模块,用于从道流量样本数据中提取相关数据特征,所述相关数据特征包括与所述协议类型对应的协议特征;将所述相关数据特征作为训练数据,输入至从联邦学习协作平台上获取的初始模型中,得到联邦学习模型及其中间参数;对所述中间参数进行加密,并将加密后的中间参数发送至联邦学习协作平台;接收所述联邦学习协作平台返回的更新后的中间参数,利用更新后的中间参数对所述联邦学习模型进行更新;将更新后的所述联邦学习模型对应的中间参数上传至所述联邦学习协作平台进行聚合,直至所述联邦学习模型收敛,所述联邦学习协作平台返回最终参数;利用所述最终参数对联邦学习模型进行更新,得到流量识别模型。可选的,在本专利技术一实施例中,所述中间参数包括样本数量、损失函数及梯度;所述样本数量及所述损失函数用于所述联邦学习协作平台确定表征联邦学习模型收敛程度的总损失函数,所述梯度用于所述联邦学习协作平台确定用以更新联邦学习模型的总梯度。可选的,在本专利技术一实施例中,所述流量识别模块具体用于根据所述流量识别模型的输出结果,判断所述流量输入数据是否为攻击流量,若是,则对攻击流量对应的账户进行封禁。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。本专利技术通过利用基于联邦学习构建的识别模型进行流量检测识别,保证了数据隐私安全,并增强流量的识别能力,实现了在确保正常流量数据的安全通信的同时,精确阻断流量数据中的隐蔽攻击,保障企业业务的安全、高效的运转。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些本文档来自技高网...

【技术保护点】
1.一种基于联邦学习的流量识别方法,其特征在于,所述方法包括:/n根据流量输入数据的协议标识,确定所述流量输入数据的协议类型;/n根据流量输入数据的协议类型,将流量输入数据的数据特征输入至对应的流量识别模型中,得到输出结果;其中,所述流量识别模型为利用横向联邦学习构建的;所述协议类型与所述流量识别模型对应;/n根据所述流量识别模型的输出结果,确定属于攻击流量的流量输入数据。/n

【技术特征摘要】
1.一种基于联邦学习的流量识别方法,其特征在于,所述方法包括:
根据流量输入数据的协议标识,确定所述流量输入数据的协议类型;
根据流量输入数据的协议类型,将流量输入数据的数据特征输入至对应的流量识别模型中,得到输出结果;其中,所述流量识别模型为利用横向联邦学习构建的;所述协议类型与所述流量识别模型对应;
根据所述流量识别模型的输出结果,确定属于攻击流量的流量输入数据。


2.根据权利要求1所述的方法,其特征在于,所述流量识别模型通过如下方式构建:
从流量样本数据中提取相关数据特征,所述相关数据特征包括与所述协议类型对应的协议特征;
将所述相关数据特征作为训练数据,输入至从联邦学习协作平台上获取的初始模型中,得到联邦学习模型及其中间参数;
对所述中间参数进行加密,并将加密后的中间参数发送至联邦学习协作平台;
接收所述联邦学习协作平台返回的更新后的中间参数,利用更新后的中间参数对所述联邦学习模型进行更新;
将更新后的所述联邦学习模型对应的中间参数上传至所述联邦学习协作平台再次进行更新,直至所述联邦学习模型收敛,所述联邦学习协作平台返回最终参数;
利用所述最终参数对联邦学习模型进行更新,得到流量识别模型。


3.根据权利要求2所述的方法,其特征在于,所述中间参数包括样本数量、损失函数及梯度;所述样本数量及所述损失函数用于所述联邦学习协作平台确定表征联邦学习模型收敛程度的总损失函数,所述梯度用于所述联邦学习协作平台确定用以更新联邦学习模型的总梯度。


4.根据权利要求3所述的方法,其特征在于,所述接收所述联邦学习协作平台返回的更新后的中间参数,利用更新后的中间参数对所述联邦学习模型进行更新包括:
接收所述联邦学习协作平台返回的总梯度;其中,所述联邦学习协作平台用于根据所述损失函数确定梯度计算权重,利用所述梯度计算权重及所述梯度确定总梯度;
利用更新后的总梯度对所述联邦学习模型进行更新。


5.根据权利要求4所述的方法,其特征在于,所述将更新后的所述联邦学习模型对应的中间参数上传至所述联邦学习协作平台再次进行更新,直至所述联邦学习模型收敛,所述联邦学习协作平台返回最终参数包括:
将更新后的所述联邦学习模型对应的样本数...

【专利技术属性】
技术研发人员:周京张诚吕博良程佩哲
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1