一种基于深度Q网络的全自动高级逃逸技术测试方法技术

技术编号：22060403 阅读：33 留言：0更新日期：2019-09-07 17:54

一种基于深度Q网络的全自动高级逃逸测试方法，包括如下步骤：S100：定义一个智能体作为学习者；S200：定义学习者的动作；S300：定义学习者的状态；S400：定义学习者的回报；S500：通过不断的学习训练，选择出一种最优的高级逃逸技术的组合，对基于所述高级逃逸技术的组合的网络入侵行为进行测试。该方法提高了逃逸技术组合的效率和攻击的成功概率。

A Test Method of Fully Automatic Advanced Escape Technology Based on Deep Q Network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度Q网络的全自动高级逃逸技术测试方法
本公开属于网络安全
，具体涉及一种基于深度Q网络的全自动高级逃逸技术测试方法。
技术介绍
伴随着网络的不断发展和智能手机的广泛应用，网络安全问题变得越来越突出，如何保证网络系统的安全变得越来越重要也越来越棘手。由于大部分网络都是高度互联的，因此都易受到网络攻击的威胁。基于网络的入侵检测系统NIDS(NetworkIntrusionDerectionSystems)，将入侵警告和安全响应进行了很好的结合，虽然在传统安全领域此方法已经很成熟，但是随着技术的不断发展，攻击变得越来越普遍并且难以测试，其中逃逸技术可以称之为这类技术的一个代表，它可以通过伪装修改网络数据流以此来逃避入侵检测系统的测试。现有的逃逸技术从实现原理上可以分为原子逃逸技术和高级逃逸技术(多种逃逸技术的组合)。其中，原子逃逸技术又可以分为四种：(1)IP分片和TCP分段的碎片化；(2)协议级误读解析；(3)负载变换；(4)应用层逃逸。另一种高级逃逸技术则是将已知的原子逃逸技术进行组合。此外还有针对NIDS/IPS的拒绝服务攻击，这种攻击能够暂时使其瘫痪，让发起的攻击可以逃逸NIDS的测试，也属于一种逃逸技术。随着逃逸技术的不断更新升级，对逃避技术的测试变得越来越困难，为了提高网络入侵检测系统测试的成功率，研究一种高效的全自动高级逃逸技术测试方法变得越来越重要。由于OSI将互联网络体系结构划分为七层，主要为：物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。由于逃逸技术主要作用于应用层到网络层，因此需要将逃逸技术先进行分类然后在进行...

【技术保护点】
1.一种基于深度Q网络的全自动高级逃逸技术测试方法，包括如下步骤：S100：定义一个智能体作为学习者；S200：定义学习者的动作；S300：定义学习者的状态；S400：定义学习者的回报；S500：通过不断的学习训练，选择出一种最优的高级逃逸技术的组合，对基于所述高级逃逸技术的组合的网络入侵行为进行测试；所述S100步骤进一步包括：所述学习者将动作作用于网络入侵测试系统NIDS，通过执行某一动作将产生新的状态且在一定条件下产生回报；所述S500步骤中进一步包括：将通过训练获取的数据按照<s，a，r，s′>组合的形式存储在回放存储器中，使用来自回放存储器中的随机选择的一小部分数据进行经验回放；其中s是当前的状态，a是当前状态下所采取的动作，r是智能体在状态s下采取动作a所获得的回报，s′是智能体在状态s下采取动作a所到达的下一步状态。

【技术特征摘要】
1.一种基于深度Q网络的全自动高级逃逸技术测试方法，包括如下步骤：S100：定义一个智能体作为学习者；S200：定义学习者的动作；S300：定义学习者的状态；S400：定义学习者的回报；S500：通过不断的学习训练，选择出一种最优的高级逃逸技术的组合，对基于所述高级逃逸技术的组合的网络入侵行为进行测试；所述S100步骤进一步包括：所述学习者将动作作用于网络入侵测试系统NIDS，通过执行某一动作将产生新的状态且在一定条件下产生回报；所述S500步骤中进一步包括：将通过训练获取的数据按照<s，a，r，s′>组合的形式存储在回放存储器中，使用来自回放存储器中的随机选择的一小部分数据进行经验回放；其中s是当前的状态，a是当前状态下所采取的动作，r是智能体在状态s下采取动作a所获得的回报，s′是智能体在状态s下采取动作a所到达的下一步状态。2.根据权利要求1所述的方法，优选的，所述S200步骤进一步包括：学习者随机选取高级逃逸技术的组合，每...

【专利技术属性】
技术研发人员：王竹晓，张彭彭，唐志国，李为，关志涛，张莹，贾静平，
申请(专利权)人：华北电力大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人