当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于深度学习图网络的加密算法识别方法技术

技术编号:25042712 阅读:32 留言:0更新日期:2020-07-29 05:33
一种基于深度学习图网络的加密算法识别方法,由训练和检查过程组成,其中:训练:对爬取的与加密相关的源码数据,构建基础源码库;经交叉编译预处理,得到二进制代码库,分别提取二进制加密算法的统计特征与结构特征整合生成加密算法图,嵌入到神经网络中变为向量,经比较向量间的距离远近判断代码是否相似,通过训练得到判断加密算法图的嵌入向量是否相似模型;检查:生成标准加密算法库,将实现规范且已经确定种类的加密算法分别挑选一份,并生成加密算法图,将未知种类的待检测加密算法也生成一份加密算法图,均嵌入训练后的模型,与标准加密算法库的嵌入依次比较向量距离,与待检测算法向量距离最短的标准算法种类即为待检测加密算法的种类。

【技术实现步骤摘要】
一种基于深度学习图网络的加密算法识别方法
本专利技术属于计算机软件安全领域,涉及算法的加密与识别,特别涉及一种基于深度学习图网络的加密算法识别方法。
技术介绍
1.1相关技术背景信息安全目前已上升到国家安全的战略地位,加密算法作为数据传输安全与否的核心,广泛的应用于政治,金融,通讯等方面。而随着LoT技术的发展,嵌入式系统也越来越多地应用于各种loT设备中,其安全性也是当前信息安全研究的重点之一。长期以来,我国在金融企业、政府机关等安全要求等级高的行业,除了沿用3DES、SHA-1、RSA等国际通用的密码算法体系和标准,还有一套国家密码管理局制定的自主可控的国产算法:国密算法,包括SM1~4、SM7、SM9、祖冲之密码算法(ZUC)等。在金融领域目前主要使用公开的SM2(非对称加密算法)、SM3(哈希算法)、SM4(对称加密算法)三种商用密码算法。国密算法比起传统国际标准算法有计算轮数多,密码复杂度高,压缩函数更加复杂等优势。由于加密技术在信息安全中的重要性,国家密码局出台了一系列措施来进行密码技术管理的规范化。然而很多情况下,有些公司和企业在进行对软甲的加密保护时存在“误用不符合规定的加密算法”、“加密算法强度不够”、“未使用加密算法”等问题。使用高强度加密措施一定会在某种程度上影响软件的性能和用户体验,某些企业为了效益最大化并未按照要求的安全标准使用加密算法进行加密,导致文件中存在大量安全隐患,用户和机关的安全隐私受到威胁。同时恶意软件也往往采用密码算法的保护机制隐藏其静态恶意特征,加大了程序逆向分析人员的剖析难度。因此,亟需一种可适用于文件的加密状态和加密算法合规性检查的技术,以支撑密码检查工作的高效推进。1.2与本专利技术相关的现有技术1.2.1密码算法检测数据加密的基本过程就是对原来为明文的文件或数据按某种算法进行处理,使其成为不可读的一段代码“密文”的过程。加密算法检测作为密码分析的重点,受到研究人员的广泛关注,MaiorcaD等人使用静态指令分析,通过加密算法中,“指令的大部分为位运算指令”这个特征来判断是否为加密算法。LiuTieming等人通过特征字匹配来进行加密算法识别,虽然识别效率很高,但是识别的误报率却难以让人接受。TzermiasZ等人通过加密算法的两个特征“密集计算型”和“大量循环操作”来分析软件的信息熵,判断是否使用了加密算法(加密过程中函数的信息熵会增加)。李继中等人在此基础上验证了密码算法内存数据的高熵值性,并且构建了信息熵动态循环加密函数,结合静态特征分析建立了分析模型。但上述方法仅能对“目标文件是否使用加密函数”这一问题进行分析,并不能得到目标函数中具体使用了哪种加密算法,而在密码分析中确定加密算法类型往往是分析的第一步。蒋烈辉等人通过构建汇编级加密算法特征向量的贝叶斯决策识别模型,利用了贝叶斯分类模型速度快、空间开销小等特点,高效的进行了加密算法分析,但准确率仍有待提高。LiuX等人使用了一种使用循环I/O的加密算法识别法。通过识别与记录程序轨迹信息中的循环结构,将其输入输出数据代入到标准加密算法中进行匹配,如匹配成功则代表使用方法与标准算法一致,但该方法无法识别无循环的加密算法,同时在O3优化级别下有些加密算法的循环结构会被隐藏(如AES),这时在汇编代码中将无法检测到加密算法。林伟等人提出一种基于数据流分析的加密算法识别方法,利用递进式多特征方法对加密算法进行识别。可以精确的定位到加密算法在函数中的位置,方便做后续的分析与查证,但由于数据流特性以及污点分析等方式的局限性,较原有方法虽有较高的精度,但其性能表现较差。1.2.2静态二进制相似性检测静态代码分析是指在不运行代码的情况下对软件进行分析,静态分析的优势是在于能够覆盖到全部代码,并且能够简单适配跨平台体系的二进制代码相似性检测方案。Havrilla等人和WesleyJin等人对组成函数的所有代码块的语义和结构进行哈希运算,然后进行二次非对称运算,通过比较这些值来比较函数是否相似。JannikPewny等人通过对二进制代码反汇编将其转化为一种中间语言VEX-IR来生成基本块的表达式,进而生成各个基本块儿的签名,生成函数的签名列表,以此来比较两个函数的相似度。但是,它基于模糊基本块的相似度比较算法开销过于昂贵,无法处理大量函数问题。discovRE利用预过滤法来增强基于CFG的匹配过程,但是它的性能仍然让人难以接受,并且预过滤不可靠,会输出过多的假阴性用例。Esh都将基本块间的数据流进行切片,并将其作为基本单元进行比较,得到了更好的结果。总之,目前信息化系统的加密算法使用情况检查主要以询问、调研等管理手段为主,缺乏有效检查技术和工具,来支撑密码检查工作的高效推进,其中,技术难点主要体现在:1、对于大部分待检测文件,无法得到目标源码;2、文件分布在不同应用系统,提取较难,需要解决文件跨平台检测的难题;3、文件格式多样,无法甄别是否进行加密,更难以判断采用的加密机制是否合规;
技术实现思路
针对上述现有技术存在的缺陷或不足,本专利技术的目的在于,提供一种基于深度学习图网络的加密算法识别方法,该方法将深度学习图网络与二进制相似性检测相结合,进行加密算法识别。为了实现上述任务,本专利技术采取如下的技术解决方案:一种基于深度学习图网络的加密算法识别方法,其特征在于,该方法由训练过程和检查过程组成,其中:训练过程是:首先对爬取的加密无关的源代码整合大量爬取的与加密相关的源码数据,来构建基础源码库;然后通过对基础源码库进行交叉编译预处理,得到二进制代码库;分别提取二进制加密算法的统计特征与结构特征整合生成加密算法图,将加密算法图嵌入到神经网络中变为向量形式,通过检查比较向量间的距离远近即可判断代码是否相似,经训练后得到有能力判断加密算法图的嵌入向量是否相似的模型;检查过程是:首先,生成标准加密算法库,将实现规范且已经确定具体种类的加密算法分别挑选一份,并生成加密算法图;接着,将未知种类的待检测加密算法也生成一份加密算法图。最后,将待检测加密算法生成的加密算法图嵌入训练完成的模型中,与标准加密算法库的嵌入依次比较其向量距离;与待检测算法向量距离最短的标准算法的种类即为待检测加密算法的种类。根据本专利技术,所述基础源码库具体由以下两部分构成:1)通过爬虫工具爬取的与加密算法无关的源代码;2)通过爬虫工具爬取的加密算法源代码。优选地,所述加密相关的数据是不同版本的开源加密库文件、项目托管平台上的加密算法源代码数据、以及通过黑帽会议中文章开源数据收集到一些加密算法。所述二进制代码为特定加密算法数据和加密无关的基础数据。进一步优选地,所述标准加密算法库为开源特征库OpenSSL中剥离出的不同种类的加密算法,在生成加密算法图之前已知其具体加密种类。本专利技术的基于深度学习图网络的加密算法识别方法,与现有技术相比,带来的技术创新在于:1、将原本需要大量领域知识的加密算法检测问题转化为不依赖领域知识本文档来自技高网
...

【技术保护点】
1.一种基于深度学习图网络的加密算法识别方法,其特征在于,该方法由训练过程和检查过程组成,其中:/n训练过程是:首先对爬取的加密无关的源代码中整合大量爬取的与加密相关的源码数据,来构建基础源码库;然后通过对基础源码库进行交叉编译预处理,得到二进制代码库;分别提取二进制加密算法的统计特征与结构特征整合生成加密算法图,将加密算法图嵌入到神经网络中变为向量形式,通过比较向量间的距离远近即可判断代码是否相似,经训练后得到有能力判断加密算法图的嵌入向量是否相似的模型;/n检查过程是:首先,生成标准加密算法库,将实现规范且已经确定具体种类的加密算法分别挑选一份,并生成加密算法图;接着,将未知种类的待检测加密算法也生成一份加密算法图;最后,将待检测加密算法生成的加密算法图嵌入训练完成的模型中,与标准加密算法库的嵌入依次比较其向量距离;与待检测算法向量距离最短的标准算法的种类即为待检测加密算法的种类。/n

【技术特征摘要】
1.一种基于深度学习图网络的加密算法识别方法,其特征在于,该方法由训练过程和检查过程组成,其中:
训练过程是:首先对爬取的加密无关的源代码中整合大量爬取的与加密相关的源码数据,来构建基础源码库;然后通过对基础源码库进行交叉编译预处理,得到二进制代码库;分别提取二进制加密算法的统计特征与结构特征整合生成加密算法图,将加密算法图嵌入到神经网络中变为向量形式,通过比较向量间的距离远近即可判断代码是否相似,经训练后得到有能力判断加密算法图的嵌入向量是否相似的模型;
检查过程是:首先,生成标准加密算法库,将实现规范且已经确定具体种类的加密算法分别挑选一份,并生成加密算法图;接着,将未知种类的待检测加密算法也生成一份加密算法图;最后,将待检测加密算法生成的加密算法图嵌入训练完成的模型中,与标准加密算法库的嵌入依次比较其向量距离;与待检测算法...

【专利技术属性】
技术研发人员:龚晓庆常原海汤战勇李朋叶贵鑫陈晓江房鼎益
申请(专利权)人:西北大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1