一种基于生成对抗网络的大规模硬件木马库生成系统及方法技术方案

技术编号:23624915 阅读:44 留言:0更新日期:2020-03-31 22:41
本发明专利技术涉及一种基于生成对抗网络的大规模硬件木马库生成系统及方法,一种大规模生成硬件木马的模型——HT‑GAN,HT‑GAN通过基于生成对抗网络模型的硬件木马生成方法代替人工设计硬件木马,提高了木马生成的数量和效率。HT‑GAN的设计是机器学习在硬件木马方面的一次突破性尝试,打破了传统人工设计木马的在效率和时间上限制,能轻松建立一个数量庞大内容丰富类型多样的硬件木马库。此方法能够生成许多现阶段不存在但是在今后可能影响重大的硬件木马,为硬件木马防控提供基础性支撑。本发明专利技术方法是在RTL代码级进行的实现和仿真。

A large-scale hardware Trojan horse library generation system and method based on generation antagonism network

【技术实现步骤摘要】
一种基于生成对抗网络的大规模硬件木马库生成系统及方法
本专利技术涉及设备硬件木马防护领域,特别涉及一种基于生成对抗网络的大规模(1000000个及以上)硬件木马库生成系统及方法,是在RTL代码级进行的实现和仿真。
技术介绍
随着大规模集成电路的广泛应用,越来越多的攻击者将硬件漏洞作为新的突破口。有关硬件木马的危害层出不穷,所以,急需对硬件木马进行分析研究从而提出应对策略。面对这种情况,已经开始有一些研究者将目光投向了硬件木马的设计及检测。但由于研究时间较短,未能形成一套严密的、完整的设计和检测机制。国内外在硬件木马这一研究领域取得了不同程度的进展。当前,与机器学习相关的硬件木马研究集中于硬件木马的检测和防护技术方面,主要包括结构与代码分析和形式验证两个方向这些工作主要集中在硬件木马的检测和防护方面,通常都是先受到攻击而后才去分析。但由于研究滞后并且样本量少,分析不够全面有效,从而造成许多的损失。
技术实现思路
本专利技术主要解决的技术问题是:克服现有技术的不足之,提供一种大规模硬件木马库生成系统及方法,使得硬件木马的本文档来自技高网...

【技术保护点】
1.一种基于生成对抗网络的大规模硬件木马库生成系统,其特征在于,包括:样本处理模块、预处理模块、训练模型模块、机器学习生成模块和建立硬件木马库模块;/n样本处理模块:搜集训练样本,通过网站已知的硬件木马和网络平台发布的硬件木马,同时基于硬件木马攻击密码设备的情况,获得1000多个硬件木马样本;/n预处理模块:使用Python脚本对初始样本进行预处理,即对获得的硬件木马进行特征提取,将提取的特征信息数据化为供深度学习的训练样本,按照训练样本的物理结构、触发条件以及功能特性分为AES-T,AES-T-Trojan,b,c,E,m,p,R,s和wb 10个训练样本集;搭建硬件木马生成式对抗网络HT-...

【技术特征摘要】
1.一种基于生成对抗网络的大规模硬件木马库生成系统,其特征在于,包括:样本处理模块、预处理模块、训练模型模块、机器学习生成模块和建立硬件木马库模块;
样本处理模块:搜集训练样本,通过网站已知的硬件木马和网络平台发布的硬件木马,同时基于硬件木马攻击密码设备的情况,获得1000多个硬件木马样本;
预处理模块:使用Python脚本对初始样本进行预处理,即对获得的硬件木马进行特征提取,将提取的特征信息数据化为供深度学习的训练样本,按照训练样本的物理结构、触发条件以及功能特性分为AES-T,AES-T-Trojan,b,c,E,m,p,R,s和wb10个训练样本集;搭建硬件木马生成式对抗网络HT-GAN模型运行需要的硬件和软件的环境,即配置服务器和安装Python,然后通过不断调节HT-GAN训练模型的结构和参数,形成能用于生成可用硬件木马的HT-GAN训练模型,调整优化HT-GAN训练模型参数的方式是小样本测试,用不同迭代次数训练HT-GAN训练模型,最后把HT-GAN模型上传到服务器上;
训练模型模块:用已分类的10个训练样本集训练硬件木马生成式对抗网络HT-GAN训练模型,将训练集样本输入判别器,判别器对训练样本集进行自主学习;同时将已设置好的噪声输入生成器,生成器在噪声的触发下,随机生成伪样本,伪样本是指生成器前期生成的样本,不作为最后输出结果,然后送入判别器进行判断;判别器根据学习的结果对伪样本判断,判断伪样本是否符合硬件木马特征,若不符合,则返回生成器,由生成器修改再次生成;若符合,则生成机器学习模型样本,并将生成样本反馈给生成器和判别器,再以生成的符合硬件木马特征的样本进行训练学习,即称为一轮迭代,在预处理模块,通过40个硬件木马样本小样本测试,设置迭代次数为200000次时,生成器与判别器的训练程度趋于平衡,训练结果符合硬件木马要求,提取最后一次迭代硬件木马生成式对抗网络HT-GAN训练模型生成的生成网络;
机器学习生成模块:将已训练成功的生成网络参数分别输入硬件木马生成式对抗网络HT-GAN学习生成模型中的生成器和判别器,生成器与判别器进行学习,用已设置好的噪声触发生成器,生成器根据对生成网络参数的学习,生成硬件木马样本,并将样本输入判别器进行判断;判别器通过对生成网络参数的学习,分析判断生成器生成的样本是否为可用硬件木马,若为真,直接输出并保存样本;若为假,直接舍弃样本,由生成器继续生成,通过对10种不同类型的硬件木马进行学习,每种类型均生成100000个样本,保存为文本文件;
建立硬件木马库模块:利用控制器控制每个生成样本文件截断,生成硬件木马集合,对每种生成样本进行RTL代码级仿真和分析,基于样本影响芯片消耗,确定该样本为可用样本,最后将所有可用样本进行整合,最终建立硬件木马库。


2.根据权利要求1所述的基于生成对抗网络的大规模硬件木马库生成系统,其特征在于:在预处理模块中,调整优化HT-GAN模型参数的方式如下:
通过小样本测试,确定模型参数,batch的大小是64,采用不同的迭代次数训练GAN,最终选择了200,000次迭代;每个生成迭代器会把鉴别器的迭代次数设定到10,使用层生成器和鉴别器的5个剩余层,深度神经网络中的每一层有128个维度;
把g...

【专利技术属性】
技术研发人员:王志强张铎吴航池亚平张健毅吕欣李阳汪永好刘彪张克君任晓蕊王禀岩曲耘涵
申请(专利权)人:北京电子科技学院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1